【东吴计算机】模型平权,推理爆发,看好端侧+应用1月20日,deepseek-R

凡梦说娱乐 2025-02-05 09:08:39

【东吴计算机】模型平权,推理爆发,看好端侧+应用

1月20日,deepseek-R1模型发布并开源,以RL路径实现了大模型的底层范式创新,大幅降低了先进模型的训练+推理成本,性能比肩SOTA(不含多模态),【标志着中国AI从跟随者走向创新者】。降本核心创新点在于DeepseekMOE架构、FP8混合精度框架、MLA多头潜在注意力机制、纯RL强化学习不依赖人工数据标注的监督微调等。目前微软、AMD等各类厂商都已宣布支持deepseek-R1并将其整合进自己的产品。

1月29日,阿里通义千问旗舰版模型Qwen2.5-Max发布,预训练数据超过20万亿tokens,比肩Claude-3.5-Sonnet,在多项公开主流模型评测基准上录得高分,甚至高于GPT-4o、DeepSeek-V3及Llama-3.1-405B。

2月3日,ChatGPT发布新Agent“Deep Research”,基于o3模型做了特殊优化,把推理大模型的思考能力用于联网搜索,综合多个信息来源,一次查询响应时间5分钟-30分钟不等,目标是“完成人类专家需要几个小时的复杂研究任务”。在“人类最后的考试”上,Deep Research刷新了最高分,比o3-mini高推理设置分数高出一倍。

影响:

1)【科技重估】Deepseek的底层创新最为重要,直接引发全球对中国科技创新的重视并对中国资产进行重估(参考美股中概上涨);

2)【引发“模型平权”思考】,开源和低成本让模型层面的差距迅速缩小,为推理侧应用(包括端侧和软件)的爆发打下基础,小型团队不需要重资产投入就可以蒸馏出先进小模型(适用于各类端侧mini场景),并且端侧算力就可以跑通小模型,2025年或是端侧的爆发元年。

3)【对算力影响】,未来的AI投入不再盲目“大力出奇迹”,逐渐将重心从预训练转向推理,但训练+推理的整体需求依然乐观。参考从2G到4G流量费用不断降低,但因为用量的指数级提升,导致整体市场规模依然快速增大。

投资思路:

1)大厂线,小米系(【金山办公】、金山云、金山软件),字节系(汉得信息、润泽科技),阿里系(杭钢股份),腾讯系(泛微网络),华为系(能科科技)等;

2)Agent线,【鼎捷数智、上海钢联(小钢机器人)】、汉得信息、泛微、彩讯、用友、金蝶;

3)端侧,移远通信、广和通、美格智能、乐鑫科技、虹软科技(AI眼镜)、萤石网络;

4)数据中台:星环科技、普元信息、第四范式、优刻得

5)其他AI应用:【科大讯飞】、同花顺、三六零、福昕软件、合合信息、税友股份、润达医疗、新致软件、焦点科技、赛意信息

0 阅读:0
凡梦说娱乐

凡梦说娱乐

感谢大家的关注