昨天深夜，谷歌突然插手OpenAI的发布会，推出Gemini2.0新模型；它

昨天深夜，谷歌突然插手Open AI的发布会，推出Gemini 2.0新模型；它能处理文本、图像、音频，还能生成文本、图像和语音，反应快，性能好，这为智能体（agents）打下基础。目前已经用在了Google Search里的AI Overviews，还有未来的Workspace里。它会支持一些新项目，比如Project Astra（能识别物体、帮助导航的视觉系统），Project Mariner（Chrome扩展，能帮用户上网），还有Jules（帮开发者找bug的代理）。演示时，谷歌实验室总监Jaclyn Konzelmann展示了Project Mariner。她在Chrome里装了个扩展，浏览器旁边就弹出个聊天窗口。用户可以告诉代理，「按清单在超市买东西」。然后AI代理就去超市网站，搜索商品，加到购物车里。不过，动作有点慢，每次操作都要等5秒，AI代理会中断任务，要求你澄清某个物品是不是这样；谷歌不允许AI代理涉及到结账、隐私、条款等信息。还有个编程智能体Jules，它帮开发者写代码。演示时，用户输入了编程问题提示，Jules就分析问题，给出了三步解决方案。用户同意后，它就开始编程，生成代码，这些代码可以直接合并到用户的代码里。谷歌还展示了如何用Gemini 2.0构建的AI智能体来辅助游戏玩家，演示中，智能体能够实时解读屏幕画面，通过语音交流给玩家提供策略建议。例如：在玩《部落冲突》时，想知道怎么攻打敌人的老巢最有效。这时，AI 智能体像军师，根据屏幕上的情况，出谋划策。它不光能提供战术建议，还能帮你盯住游戏里的任务，假如你正忙着建设你的部落，AI 智能体会提醒你别忘了还有什么任务没完成。更厉害的是，如果想要发起攻击，不知道怎么搭配兵力，它能帮你分析，告诉哪种组合可能是最优选。目前，Jules只给一小部分测试者用。想用这个模型的话，开发者和测试人员可以在Google AI Studio和Vertex AI平台上试试Gemini 2.0 Flash模型的实验版。个人是Google One AI Premium订阅者，可以在Gemini web app里用新模型；iPhone用户能通过专门的Gemini应用来用；Gemini Ultra版得等到明年。谷歌