当退居幕后多年的创始人出面解释的时候,谷歌的危机昭然若揭了。
当地时间3月2日,谢尔盖·布林(Sergey Brin)现身美国加州“AGI之家”,对谷歌旗下大模型Gemini做出评论:“我们在图像生成方面搞砸得很彻底,我认为这主要由于没有进行彻底的测试。”
身着彩色外套的谢尔盖已经50岁,胡子花白。26年前,他与拉里·佩奇(Larry Page)在车库里成立谷歌,2019年,桑德尔·皮查伊(Sundar Pichai)接替二人,在已是谷歌CEO的同时成为谷歌母公司Alpgabet的CEO。
2023年,ChatGPT掀起AI浪潮,谷歌被内外质疑“反应迟缓”,布林被传已经回到谷歌,直接参与Gemini研发,每周有三到四天在办公室和研究院一起工作,还会亲自写代码。但论直接露面实属罕见,更不要说承认谷歌“搞砸了”。
过去的一个月,谷歌在AI竞技场上化身“劳模”,大模型五连发。其中包括更新Gemini,推出付费订阅版本的Gemini Advanced(1.0 Ultra),发布Gemini 1.5 Pro和开源模型Gemma,以及提交“世界模型”Genie的论文。
但更频繁的出击引来了更大的麻烦。
更新后的Gemini支持文生图功能,但用户很快就发现其似乎“有意”避免生成白人图像,不管是美国开国元勋还是埃隆·马斯克(Elon Musk),到了Gemini这儿都得是黑人。
舆论持续发酵,对Gemini“反白人”的指控蔓延开来。谷歌紧急叫停其文生图功能,但讨论仍在继续。谷歌高管公开就此事道歉,CEO皮查伊则给员工发内部信,表示公司将进行“结构性改革”。
向前追溯,谷歌Gemini此番翻车不算偶发事件。去年谷歌发布Bard时,演示视频中Bard的回答出现事实错误。作为谷歌在ChatGPT后打出的第一拳,这个失误让公司一夜之间蒸发市值1000亿美元。
在争议之中,谷歌的股价一周跌去4%,而外界不仅质疑谷歌的结构性问题,也质疑皮查伊逆风作战的能力,并开始呼吁皮查伊下台、谷歌换将。
向外打出的AI组合拳,还没打到对手身上,就已经打了谷歌自己的“七寸”。
A
Gemini此次的翻车事件并不复杂。
用户发现,不管是键入教皇、维京人、1978年美国开国元勋、第一位女性总统、中世纪英格兰英国国王,Gemini都要么直接吐出黑人图像,要么在吐出的多张图片里最多夹一张白人面孔。当然,最离谱的还要数Gemini输出的马斯克图像——不用说也能猜得到——肤色也直逼马丁·路德金。
频频与现实叫板,和事实相悖,Gemini对少数族裔已经不能算是偏好,而是一种偏执。网友辣评:在瓦坎达(电影《黑豹》中的隐形城市),Gemini的意思是上帝的小天使。
近几年美国原本就对于“觉醒文化(Woke)”争议颇多,Gemini登时被指责“反白人”。马斯克也在自家社交媒体上转发相关帖子,并直言:“病毒式的觉醒思维正在摧毁西方文明。”
争议发酵之后,谷歌很快将Gemini的文生图功能关闭,并在社交平台X上发表声明,称Gemini在一些历史图像生成中存在不准确之处,其正在努力解决这一问题。其后,谷歌高级副总裁普拉巴卡尔·拉加万(Prabhakar Raghavan)也就此事道歉。
这对谷歌无疑是一个巨大的打击。
去年谷歌发布ChatGPT竞品Bard,但这个产品反响平平。在那之后,谷歌终结DeepMind长达9年的内部独立,将其与谷歌大脑(Google Brain)合并,成为一个新的部门谷歌DeepMind。而Gemini,自那时起就已经被谷歌当做“下一件大事”。不仅对外宣传,在内部的优先级也很高,正如前文所提及的,谷歌创始人布林也重出江湖,走上Gemini的前线。
去年年底,Gemini发布,谷歌大模型提速。今年2月,谷歌连发5招,更新Gemini、发布新模型。其中Gemini加入了文生图,新发布的Gemini 1.5 Pro系列最高可支持百万级Token,被看作GPT-5——而非GPT4——的对手。除此之外,谷歌还发布了开源模型Gemma,并且发布了一篇“世界模型”Genie的论文。
但谷歌遇到了两件囧事,一是在Gemni 1.5 Pro发布的当天,OpenAI突然亮出文生视频Sora,抢走了谷歌的风头。二是接踵而至的Gemini“反白人”争议,让谷歌舆论翻车。谷歌的遭遇,像极了中国的音乐人“汪峰”,一边当劳模,一边被群嘲。
发布的产品翻车并不是最糟糕的,更糟糕的是谷歌总是翻车,在去年Bard发布时,人们发现其演示视频中有明显的事实错误,将一张太阳系外行星照片的望远镜张冠李戴。
最糟糕的是,在频繁发布新品,频繁翻车的情况下,作为行业巨头的谷歌的内部问题愈发凸显。
B
大动作接二连三,未必就是一件好事。
一个有意思的插曲是,在谷歌宣布关闭Gemini文生图像功能几天后,谷歌云计算CEO托马斯·库里安(Thomas Kurian)在X上发布了一系列消息。但与Gemini的争议无关,库里安向大家宣布将推出新的大模型服务Gemini Business,将替代原来Workspace Enterprise的Duet AI。
一位网友讽刺道:托马斯您好!我可以用谷歌钱包(Google Wallet)里的谷歌支付(Google Pay)付钱吗?前身是安卓支付(Android Pay),在之前被称作谷歌钱包。如果不行的话,我们可以通个电话讨论一下支付事宜。我会发给你一个谷歌会议(Google Meet)链接,就是那个被称作Google Chat的,在那之前叫Duo。Duo取代了Allo,Allo取代了Hangouts。哦对了,Hangouts之前是+hangouts,取代了Talk and Voice。
不幸的是,这一长段讽刺没有一个字是假话。不断推出新的产品、用一个产品替代另一个,有时候还会将不同产品合并,这种事谷歌没少干。
这次谷歌在大模型上的各种产品,不光让外界眼花缭乱,也让员工头大。有员工给Business Insider爆料了内部梗图,比如偏头痛痛在前额,高血压痛在脑后,“试图理解我们的AI模型战略”痛在整颗脑袋。
组织失调的问题在谷歌内部仍然十分普遍。产品的混乱和产品翻车,是这个问题的最终体现。
BigTechnology创始人亚历克斯·坎特罗维茨(Alex Kanthrowitz)猜测,Gemini输出图像时注重人种多样性,“几乎可以肯定”是因为谷歌研究人员为了引导Gemini添加了某种提示词。而现在谷歌手忙脚乱,则是因为即便是谷歌信任与安全团队的员工也不知道是什么词导致了这一结果,这也反映出谷歌在某些方面缺乏问责制。
一名谷歌信任与安全团队的员工表示:“在这里,从组织上来说,不可能了解和指出谁在场、谁负责什么。”“也许是设计好的,这样就没有人因为失败而惹上麻烦。”
皮查伊在Gemini“反白人”事件后发表备忘录,称Gemini的错误是“完全不可接受的”,并将采取一系列明确的行动。其中“结构性变革”被首先提及,排在更新产品指引、改进发布流程、强大的评估之前。
即便如此,仍有人觉得谷歌的问题没那么容易解决。“这个问题非常严重,换掉一个领导或者合并两个团队可能无法解决这个问题。”
时间拉回到一年前,微软宣布推出集成GPT的新版必应(Bing),彼时公司CEO萨提亚·纳德拉(Satya Nadella)宣称要摧毁谷歌在搜索领域的高利润率,在一次采访中说:“我非常敬佩谷歌和他们所做的一切,但我想让人们知道,是我们让他们跳舞。”
AI竞赛让谷歌被迫加快脚步,但大象起舞,扭了脚踝。
C
皮查伊的“结构性变革”会是怎样的,目前还不得而知。但外界给出了更加激进的、皮查伊八成不会喜欢的选项:谷歌高层换血,皮查伊下台。
分析师本·汤姆森(Ben Thompon)此前曾指责谷歌在AI竞赛中过于胆怯,但现在他觉得谷歌的组合拳糟透了:“如果胆怯是动机,那么可以肯定地说,谷歌的Gemini完全是适得其反。”
在他看来,Gemini需要关闭的不仅是文生图像功能,其文本生成本身也一样差劲。他举例称,当有人问及“马斯克和希特勒谁更糟糕”,即便马斯克做过不少疯事,这也本该是一个很好回答的问题,但Gemini却闪烁其词地说“很难说谁对社会产生了更大的负面影响”。
汤姆森进而提出,谷歌需要一场变革,“把那些任由前者胡作非为的人赶走,包括首席执行官桑德尔·皮查伊。”
此外,伯恩斯坦(Bernstein)分析师马克·什穆利克在今日发表的一份研究报告中,也反复讨论谷歌高层是否应该进行重组:“最近的事件只会进一步引发质疑,即这个管理团队是否适合谷歌进入下一个时代。”
同行也加入了讨论行列。Helios Capital的创始人萨米尔·阿罗拉(Samir Arora)猜测“他(皮查伊)将被解雇或辞职,这是他应该做的。”
Perplexity AI CEO阿拉文德·斯里尼瓦斯(Aravind Srinivas)则指出提到可能的候选人,比如纳特·弗里德曼(Nat Friedman),曾担任GitHun的CEO,还是Midjourney的顾问,在技术领域有丰富的经历。
皮查伊在2015年和2019年分别被任命为谷歌和Alphabet的CEO,事实证明他在“和平时期”是一名出色的CEO。多年来,他以高效和稳健的行事风格,保护谷歌珍贵的搜索业务,并与监管机构积极来往。在他的任期内,谷歌市值从4000亿美元增长到1.7万亿美元。
但“和平时期”已经过去,AI浪潮带来千模大战,硝烟四起。而谷歌展现出的舞姿实在不算优美。在逆风而行时,皮查伊是否展现了足够的领导力?这是外界的质疑所在。
跳舞的大象正在踉跄,象背上的人也在跟着摇晃。大象会摔倒吗?骑象人会跌落吗?只有等着看了。