昨天深夜,谷歌突然插手Open AI的发布会,推出Gemini 2.0新模型;它能处理文本、图像、音频,还能生成文本、图像和语音,反应快,性能好,这为智能体(agents)打下基础。 目前已经用在了Google Search里的AI Overviews,还有未来的Workspace里。 它会支持一些新项目,比如Project Astra(能识别物体、帮助导航的视觉系统),Project Mariner(Chrome扩展,能帮用户上网),还有Jules(帮开发者找bug的代理)。 演示时,谷歌实验室总监Jaclyn Konzelmann展示了Project Mariner。 她在Chrome里装了个扩展,浏览器旁边就弹出个聊天窗口。用户可以告诉代理,「按清单在超市买东西」。然后AI代理就去超市网站,搜索商品,加到购物车里。 不过,动作有点慢,每次操作都要等5秒,AI代理会中断任务,要求你澄清某个物品是不是这样;谷歌不允许AI代理涉及到结账、隐私、条款等信息。 还有个编程智能体Jules,它帮开发者写代码。 演示时,用户输入了编程问题提示,Jules就分析问题,给出了三步解决方案。用户同意后,它就开始编程,生成代码,这些代码可以直接合并到用户的代码里。 谷歌还展示了如何用Gemini 2.0构建的AI智能体来辅助游戏玩家,演示中,智能体能够实时解读屏幕画面,通过语音交流给玩家提供策略建议。 例如: 在玩《部落冲突》时,想知道怎么攻打敌人的老巢最有效。这时,AI 智能体像军师,根据屏幕上的情况,出谋划策。 它不光能提供战术建议,还能帮你盯住游戏里的任务,假如你正忙着建设你的部落,AI 智能体会提醒你别忘了还有什么任务没完成。 更厉害的是,如果想要发起攻击,不知道怎么搭配兵力,它能帮你分析,告诉哪种组合可能是最优选。 目前,Jules只给一小部分测试者用。想用这个模型的话,开发者和测试人员可以在Google AI Studio和Vertex AI平台上试试Gemini 2.0 Flash模型的实验版。 个人是Google One AI Premium订阅者,可以在Gemini web app里用新模型;iPhone用户能通过专门的Gemini应用来用;Gemini Ultra版得等到明年。谷歌
昨天深夜,谷歌突然插手OpenAI的发布会,推出Gemini2.0新模型;它
王智远吖
2024-12-12 09:43:11
0
阅读:0
蜜桃boy
国外发布的Ai,自媒体大吹特吹,国内发布Ai,就冷清多了
黄小胖儿
我们【十万个为什么】还没有搞明白哦
呐呐君
谷歌Gemini的确好用,完美支持粤语
豹变2-646355728
再不努力,劈柴哥都笑不出来了