总觉得把RL翻译成「强化学习」，追求了准确，但理解门槛要比「模仿学习」这种的

真的不是郑小康 2025-01-20 17:45:06

总觉得把 RL 翻译成「强化学习」，追求了准确，但理解门槛要比「模仿学习」这种的要高。

如果把 RL 翻译成「反馈学习」——无论是奖励还是惩罚，都是与环境的互动中得到反馈，来进一步调整行为，会不会更好理解一点？

0 阅读：1

真的不是郑小康

感谢大家的关注

作者最新文章

1

DeepSeek-R1 发布两个月了。2024 年我最常用的 LLM 是 kim

2

之前发过一个小米汽车在欧洲挖人的信息，今天索性整理个全一点儿的。除了最后的政府关

3

刚发现我也被灰度到 Grok 3 的 DeeperSearch 了，本来以为我用

4

黄仁勋在 GTC 上最重要的一句话是这句：「我们目前的算力需求比我们去年同期预计

5

我理解理想宣布双 Orin 也支持 VLA 是为了平衡需求，打消 Thor 车型

6

你们有遇到这种情况吗？微信突然接不到电话了，而且没有任何提示。如何发现，只有你点

7

满血版车位到车位，4 月开始全量推送。你给我翻译翻译，什么叫满血版？看了下表，还

8

这张图，就很妙。今后极氪最入门的车，起步双 Orin。H9 当然就是极氪 9X

9

特斯拉整车工程副总裁 Lars Moravy 透露 CyberCab 计划以不到

10

领克 900 100 km/h 尾碰 + 100 km/h 侧碰，SPA Ev

热门分类

推荐热榜军事 NBA 体育社会明星八卦娱乐财经科技汽车历史国际游戏动漫公益搞笑商业互联网数码国际足球房产家居时尚科学探索职场育儿股票教育影视情感热点中国军情武器中国南海中国足球亚洲杯科比综合体育 CBA 投资楼市大咖秀外汇创业风口 SUV 豪车概念车优惠新能源美国欧洲朝日韩俄罗斯孕期街拍恋爱攻略婚姻正能量

汽车TOP

1

工信部曝光小米YU7全新轮毂，这次选配还是挺多的。

2

小米YU7内饰谍照来了远端带鱼屏稳了但好像网友们更喜欢翻转仪表，觉得有仪

3

全程看完比亚迪超级e平台发布会，心中只有2个字：震撼！油车加油5~8分钟很快是吧

4

坦克300昨日，2025款坦克300正式上市，提供3种动力、4款车

5

新车又暴跌了，一些当年的热门车，现在是真便宜啊！

6

说明不买奔驰就可以盖更大的楼

7

2025款小鹏G9顶配27.88万元3月13日晚，2025款小鹏G9正式上市，

8

有人预测国内汽车业未来基本只剩3-7家!1、比亚迪--可能性99%2、奇瑞

9

2025年2月中型SUV销量TOP20

10

工信部上新小米YU7选配信息！轮毂花样直接多到飞起，这鸭尾、后扰流板、前盖装饰件

汽车最新文章

1

这就是现实：电车20万，使用10年，电费1万，卖2万。油车20万，使用10年

2

工信部上新小米YU7选配信息！轮毂花样直接多到飞起，这鸭尾、后扰流板、前盖装饰件

3

工信部曝光小米YU7全新轮毂，这次选配还是挺多的。

4

小米YU7这个轮毂配色也太多了吧。这应该是我看过工信部车展轮毂配色最多的车了[哈

5

2025最新买车流行攻略三年不换车——买德系；六年不换车——买美系；

6

恐怕今晚没有一个车企笑得出来。看完比亚迪发布会，真是让人头皮发麻。别说普

7

这就是赤裸裸的现实！油车30万：使用10年，油费10万，卖5万！纯电车3

8

听我一句劝，2025年，买车不纠结：1、要质量——买丰田！2、要

9

2020年丰田净利润1327亿元2021年丰田净利润1471亿元2022年丰

10

意大利美女总理梅洛尼没想到，法国总统马克龙也没想到，欧盟主席冯德莱恩都懵圈了，在