阿里巴巴开源AI模型R1-Omni:视频解读人类情绪对标OpenAI

游乐看科技 2025-03-13 10:26:24

阿里巴巴开源 AI 模型 R1-Omni :视频解读人类情绪对标 OpenAI 阿里巴巴旗下通义千问实验室开源R1-Omni模型,该模型基于可验证奖励的强化学习(RLVR)技术,可分析视频中人物的情绪状态,并识别环境与服饰等关联因素。演示显示,R1-Omni能准确推测视频人物的情绪,明确多模态信息(视觉、听觉)对情绪判断的影响,提升推理能力与泛化性能。  该模型被视为对标OpenAI的GPT-4.5,后者虽能识别文本中的情绪线索,但定价高昂(月费200美元)。此次开源进一步强化其在多模态领域的竞争力。

0 阅读:4
游乐看科技

游乐看科技

感谢大家的关注