这两天Deepseek霸热搜,那它到底是干什么的?我专门查了一下↓↓
- 语言模型方面:2024年1月5日发布了DeepSeek LLM,包含670亿参数。2024年5月7日发布了第二代开源混合专家模型DeepSeek-V2,在实现更强性能的同时节省了训练成本。2024年12月26日,上线DeepSeek-V3,在知识类任务上水平显著提升,在数学竞赛上大幅超过其他开源闭源模型。2025年1月20日,推出了新一代开源大模型DeepSeek-R1,性能比肩OpenAI的o1大模型正式版。
- 代码模型方面:2024年1月25日发布DeepSeek Coder,2024年6月17日发布DeepSeek Coder-V2,支持的编程语言从86种扩展到338种,上下文长度从16k扩展到128k,在编码和数学基准测试中表现优异。
- 多模态模型方面:2024年3月11日发布了DeepSeek VL,2024年12月13日发布用于高级多模态理解的专家混合视觉语言模型DeepSeek VL2,在视觉问答、光学字符识别等多种任务中展现卓越能力。
提供应用服务
- 智能对话:能够像人类一样进行日常对话,理解对话的上下文和意图,给予恰当回应,用户可以和它谈论兴趣爱好、生活琐事、工作学习等话题。
- 文本生成:可以创作故事、诗歌、散文等文学作品,也能撰写新闻报道、商业文案、学术论文等各种类型的文本。
- 语义分析与知识问答:能对输入的文本进行语义分析,回答各种领域的问题,无论是科学原理、历史事件还是生活常识等,都能提供准确答案。
- 计算推理与代码编写:可以解决数学问题,进行逻辑推理和计算,还能够编写各种编程语言的代码,帮助开发者提高工作效率。
- 语言翻译:支持多种语言之间的翻译,帮助用户跨越语言障碍,实现准确的交流。