【华为官宣:DeepSeek系列模型正式上线昇腾社区】2月5日消息,今日,

科学制造的力量 2025-02-05 15:57:08

【华为官宣: DeepSeek 系列模型正式上线昇腾社区】2月5日消息,今日,华为宣布,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用。

据了解,DeepSeek-V3首个版本于2024年上线并同步开源,为自研MoE模型,671B 参数,激活37B,在14.8T token上进行了预训练。

据DeepSeek介绍,DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B 等其他开源模型,并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。

0 阅读:0
科学制造的力量

科学制造的力量

感谢大家的关注