科大讯飞发布深度推理大模型,做数学题毫无压力

钱江晚报 2025-01-17 07:05:09

潮新闻客户端记者甘居鹏

1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模型——讯飞星火X1。该模型中文数学能力国内第一,并率先应用于教育、医疗等刚需场景。同时,讯飞星火4.0Turbo底座能力再次迎来全新升级,图文、数学和长文本能力显著提升,并首发混域知识搜索技术,进一步解决行业、企业痛点。

尽管在全国产算力平台上训练深度推理模型遭遇了诸多挑战,但科大讯飞携手华为,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型。

发布会上,科大讯飞研究院的研究员们依次展示了讯飞星火X1解答高考题、AIME竞赛题以及高中奥赛题的表现。讯飞星火X1不仅准确给出了这些题目的答案,还对解题思路和步骤进行了详细拆解。与通用大模型相比,其解题过程更接近人类的“慢思考”方式。

过程中,讯飞星火X1充分展现深度推理模型的三大典型特征:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

值得一提的是,讯飞星火X1在近期参加的小初高(含竞赛)、大学(含竞赛)、AIME、MATH500等多项“考试”中成绩十分亮眼,用更少的算力,实现了业界一流的效果。

数学能力一直是讯飞星火的强项,此次基于讯飞星火X1的高质量合成数据,讯飞星火4.0Turbo的数学能力变得更强,可以在数学教学、金融分析和科研推演等工作中更好的帮助用户。

图文识别能力直接关乎着企业能否高效的采编和利用行业、私域数据,是大模型“学习”的基础。在各行各业的实际工作中,经常面临图文识别的“疑难杂症”:如医疗的体检报告、法院的文书、学术论文、企业合同等,还有复杂长表格、杂乱板式、手写公式、印章手写合同、倾斜少线等情况,讯飞星火4.0Turbo图文识别能力升级,使得通用文档版面分析、文字识别的准确率相对提升了40%,复杂表格结构、潦草手写文字等方面的准确率相对提升了60%,可以解决上述难题、大幅提升高价值数据的获取能力。对比测试表明,讯飞星火4.0Turbo的图文识别能力显著领先国内外顶尖竞品。

此次升级还针对性地提升了文档要素检测能力,在知识切分和构建的粒度上更加精细、准确,能有效防止大模型幻觉,同时发布了扫描文档解析的极速版本,文档理解速度提升了10倍以上。对于一份500页的项目文件,从扫描、识别到解析的全过程,仅需2分钟即可全部完成。

0 阅读:34