阶跃星辰STEPR-MINI全量上线|1月16号中午,阶跃星辰研发的推理模

王智远吖 2025-01-18 08:16:11

阶跃星辰STEP R-MINI全量上线 | 1月16号中午,阶跃星辰研发的推理模型Step R-mini上线了,已经在跃问网页端全面开放。我体验一整天,感觉它的理解能力、推理回答能力,和其他模型差不多。 如果你不太关注国产AI领域,可能没怎么听说过它。 这家公司2023年4月成立,总部在上海。阶跃星辰和MiniMax一样,走的是「模型+应用」的路子,自己研发模型,然后再开发应用。 它的代表模型是Step系列,已经更新到Step-2了。它有两个核心产品:一个是AI聊天平台跃问,还有一个是AI角色扮演类产品冒泡鸭。 它的官网有一种像马斯克xAI探索宇宙的感觉,根据官方公布的数据,它有三个技术优势。 一,它坚持Scaling Law原则,包括强化学习、数据质量、测试时计算和模型规模的扩展。二,它文理兼修,在数学基准测试和代码任务上表现挺好,既能解决逻辑推理、代码和数学等复杂问题,也能搞文学创作等通用领域。 第三,它通过大规模的强化学习训练,并使用On - Policy强化学习算法,实现了文理兼修。 应用方面,我体验后发现它在解题上推理能力很强。比如,我给它一个奥数题,它能一步一步构建推理链,像个小老师一样给我讲解,还尝试多种解法交叉验证,连我这个数学不好的人都忍不住多学了两道题。 处理几何题时,它还会主动画草图,帮我更好地理解题目,感觉它就像有双无形的手在帮我解题。 逻辑推理任务中,它也不慌不忙。我跟它说,你能帮我查一下某公司的财报数据吗?它就跟我互动起来,问我对某些数据的看法。并且会根据我一次次反馈的问题,优化它的答案。 不过,我发现,它有时候会“过度思考”,这好像是国产推理模型的“通病”,在思考过程中,会出现大量的自我怀疑、自我否定。 比如:9.9和9.11哪个大,这个经典问题。 推理过程充斥着大量的“但是,等一下,这好像不对”“让我再想想,也许我弄错了”“但是,我仍然觉得有点困惑”等自我否定的思考,直到最后自己把自己说服。 代码题我没测试,这方面不是我擅长的,你可以试试。 内容创作上,我把经常用的提示词拿它和Kimi、海螺AI、deepseek - V3的回答对照了一下,海螺AI会故意加一些情感,它的回答和其他几家差不多。 赶紧去试试,阶跃星辰跃问地址:,现在应用商店也有了APP。

0 阅读:2
王智远吖

王智远吖

感谢大家的关注