读了一下OriolVinyals所说的「蒸馏法」最早的一篇论文，即发布于2

墨者在此 2025-02-08 05:21:06

读了一下Oriol Vinyals 所说的「蒸馏法」最早的一篇论文，即发布于 2015年的 Distilling the Knowledg in a Neural Network

发现信息量其实比预想的要大:

1. 其实此论文是对 2006 年的一篇论文 Models Compression 的一般化，即采用了一个温度参数来作为 softmax，而 Models Compression 就是其特例，即 T = 1

2. 无论此论文还是 Models Compression 都认为这是一种知识压缩方法，compress the knowledge in an ensemble into a single model

有意思吧？但是好像现在搞神经网络的人都不清楚这个概念。其实他们在做的本质就是在寻找一个更紧凑的压缩模型来接近无损的存储信息

3. 论文中明确提到了，当 T 介于 2.5 和 4 之间的时候，会获得最佳的效果，而且还指出(图三)

诸位，这就非常有意思了

这可能表明蒸馏法的这个温度很可能等价于条件概率组合的数量，即我们所说的进制，理论上自然数 e，即 2.718... 会是最佳的

4. 此论文其实不止提出了蒸馏法，还提出了可以并行训练，提高训练速度的方法，而且明确指出， Mixture of Experts MoE 是做不到并行训练的

总之，此论文其实应该算是 Models Compression 的一般化方法，并且其理论体现发恰恰正是信息论的熵理论，只是这两个论文之间相差了 10 年，而且现在搞人工智能人普遍不知道信息论

.

0 阅读：1

感谢大家的关注

作者最新文章

1

「黄帝内经」中对「营气」和「卫气」的描述，就已经表明古人很早就对身体中有两大类营

2

吉尔吉斯斯坦还真的是令人惊讶有网友提到一位叫做”玉仁慈“的女孩是中亚之花，吉尔吉

3

唐朝魏征说过「以铜为镜，可以正衣冠；以史为镜，可以知兴替；以人为镜，可以明得失」

4

看到有道家的人对封神2的评价，可见封神2的确非同小可所以大家最好还是去查一下背后

5

2013年发表的一篇论文「中国与瑞典科学家联手破解循经感传现象之谜」其中介绍了一

6

不知道这样的判断依据来自什么？他不知道汉武帝时候就启用了匈奴人做将军甚至做宰相么

7

有个博主介绍封神演义时提到，中国神魔小说是在嘉靖年间开始出现的，包括西游记，东游

8

最近看到吉尔吉斯斯坦的总统及其夫人的照片，我其实有点意外的，因为总统夫人看起来很

9

我们其实目前对哺乳动物的智能了解都非常少比如对猫的试验，发现交感神经存在 10H

10

数据压缩，对智能体而言肯定也是非常重要的，不然它存储不了多少知识，或者存储海量的

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

历史TOP

1

第一次见，清朝这么多等级吗？

2

1591年，努尔哈赤灭了一族，将仅剩的一女抢回去做了妾室。努尔哈赤三五不时地宠幸

3

1949年，马步芳包了3架飞机，带着200多名家眷前往沙特。出发前，他得意地说：

4

乌克兰之所以不愿意承认失败，是有前车之鉴的，那就是1979年到1989年的苏联入

5

整个春秋时期，晋国一直是无敌的存在，虽然晋楚争霸持续了上百年，但南方的楚国始终被

6

公元604年，杨坚病重，宣华夫人陈氏和太子杨广日夜守护在床前。一天，陈氏出门更衣

7

252年，71岁的孙权病重，20岁出头的潘皇后日夜照顾，疲惫不堪。一天夜里，几个

8

1941年，一群犹太居民被带到帕茹斯特森林，正当她们将要被处决时，立陶宛民兵成员

9

2019年，美国一艘失踪了75年的王牌潜艇，在东海453米深的海底，被中国海洋测

10

1420年，明成祖朱棣，活剐近3000宫女。他坐在旁边亲自观刑，其中有一宫女，临

历史最新文章

1

元始天尊：十二金仙还剩最后一位，这最后一个位置就给你吧！申公豹愣住了，直摇头

2

长沙战役打赢了三次，为什么第四次长沙战役惨败？其实道理很简单，前三次长沙战役，日

3

1956年10月6日，毛主席一行“私自”在外面吃了顿羊肉泡馍。付账时，大家全都看

4

1950年的某一天，孙立文疲惫下班，钻进被窝，一把搂过妻子，可却摸出不对劲，立刻

5

1984年，战士李陶雄中弹后抢救无效，壮烈牺牲。他的遗体却在送往安葬途中两次掉落

6

第一次见，清朝这么多等级吗？

7

1939年，独1旅副旅长24岁还单身，战友们给他介绍了一个女排长，谁知，当副旅长

8

公元前196年，韩信死，刘邦架起油锅要炸韩信的谋士蒯彻，两边的大臣都在围观，五花

9

1591年，努尔哈赤灭了一族，将仅剩的一女抢回去做了妾室。努尔哈赤三五不时地宠幸

10

252年，71岁的孙权病重，20岁出头的潘皇后日夜照顾，疲惫不堪。一天夜里，几个