DeepSeek放出了新模型R1系列,R1-Zero和R1,R1在数学、代码和推

JavaEdge聊AIss 2025-01-21 00:16:54

DeepSeek放出了新模型R1系列,R1-Zero和R1,R1在数学、代码和推理任务方面与OpenAI-o1相当 R1,671B参数(激活37B),支持128K上下文 除了R1-Zero、R1外,还开源了基于Llama和Qwen蒸馏出的六个小规模的模型(DeepSeek-R1-Distill系列),其中DeepSeek-R1-Distill-Qwen-32B在多个基准测试中超过了OpenAI o1-mini人工智能 程序员 gpt4 软件开发

0 阅读:2
JavaEdge聊AIss

JavaEdge聊AIss

感谢大家的关注