AndrejKarpathy说他现在大约80-90%的时间用的还是

真的不是郑小康 2025-02-06 20:45:10

Andrej Karpathy 说他现在大约 80 - 90% 的时间用的还是 GPT-4,只有遇到非常复杂的问题才会用 o1 或 R1 这种推理模型。

主要是用下来如果你问的是一个非常简单的问题,会发现这类模型有点儿过度处理。有时候本不需要思考几十秒...

——

我用下来也是如此,但我也在琢磨,从产品的角度,让用户自己根据问题选模型其实不是一个好体验。人看到一个问题也不会先决策,这个问题还分配给系统一还是系统二,是无缝发生的。

很期待 Anthropic 的做法,在训练阶段逐步增加强化学习的幅度,根据问题模型自主决策思考强度来回答问题,实际体验会是啥样。

0 阅读:0
真的不是郑小康

真的不是郑小康

感谢大家的关注