【东吴计算机】模型平权，推理爆发，看好端侧+应用1月20日，deepseek-R

【东吴计算机】模型平权，推理爆发，看好端侧+应用

1月20日，deepseek-R1模型发布并开源，以RL路径实现了大模型的底层范式创新，大幅降低了先进模型的训练+推理成本，性能比肩SOTA（不含多模态），【标志着中国AI从跟随者走向创新者】。降本核心创新点在于DeepseekMOE架构、FP8混合精度框架、MLA多头潜在注意力机制、纯RL强化学习不依赖人工数据标注的监督微调等。目前微软、AMD等各类厂商都已宣布支持deepseek-R1并将其整合进自己的产品。

1月29日，阿里通义千问旗舰版模型Qwen2.5-Max发布，预训练数据超过20万亿tokens，比肩Claude-3.5-Sonnet，在多项公开主流模型评测基准上录得高分，甚至高于GPT-4o、DeepSeek-V3及Llama-3.1-405B。

2月3日，ChatGPT发布新Agent“Deep Research”，基于o3模型做了特殊优化，把推理大模型的思考能力用于联网搜索，综合多个信息来源，一次查询响应时间5分钟-30分钟不等，目标是“完成人类专家需要几个小时的复杂研究任务”。在“人类最后的考试”上，Deep Research刷新了最高分，比o3-mini高推理设置分数高出一倍。

影响：

1）【科技重估】Deepseek的底层创新最为重要，直接引发全球对中国科技创新的重视并对中国资产进行重估（参考美股中概上涨）；

2）【引发“模型平权”思考】，开源和低成本让模型层面的差距迅速缩小，为推理侧应用（包括端侧和软件）的爆发打下基础，小型团队不需要重资产投入就可以蒸馏出先进小模型（适用于各类端侧mini场景），并且端侧算力就可以跑通小模型，2025年或是端侧的爆发元年。

3）【对算力影响】，未来的AI投入不再盲目“大力出奇迹”，逐渐将重心从预训练转向推理，但训练+推理的整体需求依然乐观。参考从2G到4G流量费用不断降低，但因为用量的指数级提升，导致整体市场规模依然快速增大。

投资思路：

1）大厂线，小米系（【金山办公】、金山云、金山软件），字节系（汉得信息、润泽科技），阿里系（杭钢股份），腾讯系（泛微网络），华为系（能科科技）等；

2）Agent线，【鼎捷数智、上海钢联（小钢机器人）】、汉得信息、泛微、彩讯、用友、金蝶；

3）端侧，移远通信、广和通、美格智能、乐鑫科技、虹软科技（AI眼镜）、萤石网络；

4）数据中台：星环科技、普元信息、第四范式、优刻得

5）其他AI应用：【科大讯飞】、同花顺、三六零、福昕软件、合合信息、税友股份、润达医疗、新致软件、焦点科技、赛意信息

0 阅读：0

【东吴计算机】模型平权，推理爆发，看好端侧+应用1月20日，deepseek-R

小米汽车有人曝光了几张小米生产线的图，说这都2025年了，还在拿着纸质工单到

……用户也不是非得要知道思考过程[doge].

节后哪个概念能够脱颖而出？1、Deepseek概念2、Ai智能体概念3、宇树机器

ai的可怕之处已经显现了。我有个朋友是网上开店的，短短两年多时间，就已经是双皇

麦当劳外卖员🍟

美国定居的高中同学告诉我，DeepSeek的出现，让美国人彻底慌了，特别是硅谷的

怪不得穷人更穷，富人却可以更富！人工智能领域的黑科技deepseek的出现，

2.02酷云播放量