【Open-R1:开源社区携手复现DeepSeekR1的训练管线和数据集。亮点

爱生活爱珂珂 2025-02-03 10:31:35

【Open-R1:开源社区携手复现DeepSeek R1的训练管线和数据集。亮点:1. 成功复现DeepSeek在MATH-500基准上的评估结果,平均准确率超90%;2. 高效的合成数据生成,每秒可处理32个请求;3. 社区贡献丰富,涵盖多种模型和数据集】

'Open-R1: Update 1'

完整URL:

0 阅读:1
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注