DeepSeek放出了新模型R1系列,R1-Zero和R1,R1在数学、代码和推理任务方面与OpenAI-o1相当 R1,671B参数(激活37B),支持128K上下文 除了R1-Zero、R1外,还开源了基于Llama和Qwen蒸馏出的六个小规模的模型(DeepSeek-R1-Distill系列),其中DeepSeek-R1-Distill-Qwen-32B在多个基准测试中超过了OpenAI o1-mini人工智能 程序员 gpt4 软件开发
DeepSeek放出了新模型R1系列,R1-Zero和R1,R1在数学、代码和推
JavaEdge聊AIss
2025-01-21 00:16:54
0
阅读:2