昨天看DeepSeekr1模型的技术报告,其中有个非常有意思的点...在R1

嘉敏说科技 2025-02-24 21:33:21

昨天看DeepSeek r1模型的技术报告,其中有个非常有意思的点... 在R1思维过程中他会自动使用多种语言进行思考。

虽然使用多种语言进行思考对于模型来说是有好处,但对于做校正的工作人员来说是有困难的,所以限制模型在一段思考中只使用一种语言。加上这个限制之后大模型的能力稍微的降低了。

这个问题想到人类建造巴别塔的故事,有点哲学映射在里头。同时拿这个问题去问了deepseek,他给出的回答也挺好的(参考图片)。

0 阅读:46

评论列表

用户16xxx93

用户16xxx93

2
2025-02-25 07:43

这么牛,反正比我牛,我答不出来

嘉敏说科技

嘉敏说科技

感谢大家的关注