生成式AI的采用速度和范围超过了当今任何其他技术,许多公司已经看到投资回报并正在扩大使用案例。供应商正在全面为企业软件产品添加生成式AI功能,AI开发者今年也没有闲着。我们还看到了智能AI、多模态AI、推理AI以及可与最大商业供应商相媲美的开源AI项目的出现。
根据美国银行9月发布的全球研究分析师和策略师调查,2024年是确定投资回报的一年,而2025年将是企业AI采用的一年。
美国银行研究院内容策略师Vanessa Cook表示:"在未来5到10年内,美国银行全球研究预计生成式AI将推动企业效率和生产力的演变,这可能会改变全球经济以及我们的生活。"
小型语言模型和边缘计算
今年和去年的大部分关注点都集中在大型语言模型上 - 特别是各种版本的ChatGPT,以及Anthropic的Claude和Meta的Llama等竞争对手。但对于许多商业用例来说,LLM过于庞大,成本太高,速度也太慢,无法实际使用。
Upwork AI和ML负责人Andrew Rabinovich表示:"展望2025年,我预计小型语言模型,特别是定制模型,将成为许多企业更常见的解决方案。"他说,LLM不仅昂贵,而且范围非常广,并不总是与特定行业相关。
他补充说:"相比之下,较小的模型更有针对性,允许企业创建精确、高效、稳健的AI系统,围绕其独特需求构建。"此外,这些模型可以更容易地在公司自己的数据上进行训练,因此Upwork正开始拥抱这种转变,在其平台上20多年的互动和行为数据上训练自己的小型语言模型。他说:"我们的定制模型已经开始为帮助自由职业者创建更好的提案或企业评估候选人等体验提供动力。"
小型语言模型也更适合边缘和移动部署,就像苹果最近的移动AI公告一样。沃尔玛全球技术高级副总裁兼首席运营官Anshu Bhardwaj表示,不仅消费者将从移动AI中受益。
她说:"企业,特别是那些拥有大量员工和客户基础的企业,将为设备上AI的采用设定标准。我们可能会看到越来越多的技术提供商在开发设备技术时将大型企业放在首位。"
AI将接近人类推理能力
9月中旬,OpenAI发布了一系列新模型,声称可以像人一样思考问题。该公司表示,它可以在物理、化学和生物学具有挑战性的基准测试中达到博士水平的表现。例如,之前最好的模型GPT-4o只能解决国际数学奥林匹克竞赛13%的问题,而新的推理模型解决了83%。
Publicis Sapient首席产品官Sheldon Monteiro说:"它在推理逻辑类型问题方面非常出色。"这意味着公司可以将其用于棘手的代码问题,或需要权衡风险的大规模项目规划。
Gartner分析师Arun Chandrasekaran表示,如果AI能够更好地推理,那么AI代理就有可能理解我们的意图,将其转化为一系列步骤,并代表我们行事。他补充说:"推理还可以帮助我们将AI更多地用作决策支持系统。我并不是说所有这些都会在2025年发生,但这是长期的方向。"
根据Gartner最新的AI炒作周期,人工通用智能仍然需要十多年的时间。
经过验证的用例大规模增长
Monteiro表示,今年我们已经看到一些用例被证明具有投资回报。到2025年,这些用例将得到大规模采用,特别是如果AI技术集成到公司已经使用的软件平台中,使其非常容易采用。
他说:"客户服务、营销和客户开发领域将会看到大规模采用。在这些用例中,我们有足够的参考实施可以指出并说,'这里有价值可获得。'"
他预计,从用户需求研究到项目管理,再到测试和质量保证,软件开发的所有领域都会发生同样的情况。"我们已经看到了如此多的参考实施,并且我们已经进行了如此多的参考实施,我们将看到大规模的采用。"
敏捷开发的演变
敏捷宣言于2001年发布,此后,这种开发理念steadily取代了之前的瀑布式软件开发方法。
Monteiro说:"在过去15年左右的时间里,它一直是现代软件开发工作的事实标准。"但是敏捷是围绕人类的局限性组织的 - 不仅仅是我们编码速度的局限性,还包括团队如何组织和管理,以及如何安排依赖关系。
今天,生成式AI是一个辅助工具,用于提高团队成员的个人生产力。但Monteiro说,整个过程需要重新设计,以充分利用这项技术。他补充说:"我们必须考虑如何与同事互动,以及如何与AI互动。人们对用于代码开发的AI过于关注,而实际上这只是整个软件开发过程的一小部分。"
加强监管
9月底,加利福尼亚州州长加文·纽瑟姆(Gavin Newsom)签署了一项法律,要求生成式AI开发者披露他们用于训练系统的数据,该法律适用于向加州人公开提供生成式AI系统的开发者。开发者必须在2026年初前遵守,这意味着他们将有一年多的时间来建立系统,以跟踪其训练数据的来源。
Gibson, Dunn & Crutcher LLP律师事务所AI实践联合主席Vivek Mohan说:"实际上,许多人确实在加州有联系,特别是在AI领域。""世界上许多领先的技术公司总部都设在这里,他们中的许多公司都在这里提供工具,"他说。但是,美国和国外已经有许多其他法规涉及数据隐私和算法决策等问题,这些法规也适用于生成式AI。
例如,在决定是否批准贷款、医疗程序、支付保险索赔或提出就业建议时使用AI。Mohan说:"这是一个领域,人们普遍认为我们应该批判性地思考这个问题。""没有人希望被一台没有责任感的机器雇用或解雇。这是你可能想让律师检查的一个用例。"
还有关于使用深度伪造、面部识别等的法规。最全面的法律是去年夏天生效的欧盟AI法案,公司也必须从2026年中期开始遵守,所以2025年又是他们需要做好准备的一年。
Gartner的Chandrasekaran说:"欧盟AI法案很可能会导致世界其他地方出台更多法规。这是治理方面的一个进步,试图确保AI以对社会有益的方式使用。"
AI将变得易于访问和无处不在
Ernst & Young的首席顾问Rakesh Malhotra回忆说,当互联网首次出现时,早期采用者需要学习HTML才能拥有网站。用户需要调制解调器、特殊软件和互联网提供商的账户。"现在你只需输入你要查找的单词,"他说。对于生成式AI,人们仍然处于试图弄清楚生成式AI是什么、它如何工作以及如何使用它的阶段。
他说:"这种情况会大大减少。"但生成式AI将变得无处不在,并无缝地融入工作流程,就像今天的互联网一样。
代理将开始取代服务
Malhotra说,软件已经从运行在大型机上的大型单体系统演变为桌面应用程序、分布式基于服务的架构、Web应用程序和移动应用程序。现在,它将再次演变。"代理是下一个阶段,"他说。代理可以比服务更松散地耦合,使这些架构更灵活、更有弹性和更智能。这将带来一套全新的工具和开发流程。
今天,AI代理相对昂贵,对于寻求部署大规模系统的公司来说,推理成本可能会迅速累积。"但这种情况会改变,"他说。"随着成本的降低,用例将会爆炸性增长。"
主动助手的兴起
Malhotra补充说,除了代理取代软件组件外,我们还将看到主动助手的兴起。以跟上法规为例。今天,顾问通过继续教育来了解新法律,或联系已经是这些法律专家的同事。新知识需要时间才能传播并被员工充分吸收。
Malhotra说:"但AI代理可以立即更新,以确保我们所有的工作都符合新法律。这不是科幻小说。我们现在正在为客户做这项工作 - 一个不太先进的版本,但明年它将成为一件很正常的事情。"
这不仅仅是跟上监管变化。假设一个供应商发布了一个新的软件产品。企业客户需要确保它符合他们的要求。这可以以自动化的方式发生,供应商的代理与客户的代理对话。Malhotra说:"今天这是通过会议和报告发生的。但很快,一旦我们克服了一些新鲜感,这一切都将在数字上发生。"
他补充说,很快,没有AI助手参加会议就像会计师试图在没有Excel的情况下工作一样。"如果你不使用适当的工具,这就是你不是这份工作的合适人选的第一个迹象。"
IEEE成员、Augment Therapy(一家数字健康公司)云和新兴技术实践负责人Carmen Fontana表示,AI代理仍处于早期阶段。"但我发现它们在减少繁琐工作方面非常有用。"她说,代理的下一步是将所有不同渠道的通信整合在一起,包括电子邮件、聊天、短信、社交媒体等。
她说:"制作更好的电子表格不会成为头条新闻,但事实是,工作场所AI代理带来的生产力提升可能比一些更引人注目的AI应用产生更大的影响。"
多代理系统
当然,AI代理很有趣。但当代理开始相互交谈时,事情将变得真正有趣,Cognizant AI首席技术官Babak Hodjat说。当然,这不会一夜之间发生,公司需要小心,确保这些代理系统不会失控。
首先,代理必须能够识别它是否有能力执行任务,以及任务是否在其职权范围内。今天的AI在这方面经常失败,但公司可以建立护栏,辅之以人工监督,以确保代理只做它们被允许做的事情,而且只有在它们能做好的时候才做。其次,公司需要建立系统来监控这些任务的执行,以确保它们在法律和道德的界限内。第三,公司需要能够衡量代理对其表现的信心程度,以便在信心度低时引入其他系统或人类。
Hodjat说:"只有通过所有这些关卡,你才能让代理自主行动。"他建议公司尽可能保持每个单独代理的规模小。他补充说:"如果你有一个代理,告诉它做销售部门的所有事情,它会经常失败。但如果你有很多代理,给它们更小的责任,你会看到更多工作被自动化。"
Chief of Staff Network(一个专业发展组织)总经理Rahul Desai表示,Sailes和Salesforce等公司已经在开发多代理工作流程。"将这与思维链推理结合起来,或者说AI代理能够通过多个步骤推理问题 - 最近被纳入新的ChatGPT-o1模型中 - 我们可能会看到人人都可以使用的领域专家AI的兴起,"他说。
多模态AI
人类和我们建立的公司都是多模态的。我们阅读和写作文本,我们说话和倾听,我们看和画画。我们通过时间做所有这些事情,所以我们理解有些事情先于其他事情发生。今天的AI模型大多是片段化的。一个可以创建图像,另一个只能处理文本,一些最新的模型可以理解或生成视频。
"当人们想要进行语音生成时,他们会使用专门的文本转语音模型,"Chandrasekaran 表示。"或者使用专门的图像生成模型。"要全面理解世界如何运作,实现真正的通用智能,AI 必须能够跨越不同的模态。虽然现在已经有一些这样的技术,但通常多模态只是一种假象,实际工作是由不同的专用单模态模型在幕后完成的。
"从架构上看,这些模型是分开的,供应商使用的是专家混合架构,"Chandrasekaran 说。然而,他预计明年多模态将成为一个重要趋势。多模态 AI 可以更准确、更能抵抗噪音和缺失数据,并能增强人机交互。事实上,Gartner 预测到 2027 年,40% 的生成式 AI 解决方案将是多模态的,而 2023 年这一比例仅为 1%。
多模型路由
多模型路由与多模态 AI 不同,它指的是公司使用多个大语言模型来驱动其生成式 AI 应用。不同的 AI 模型在不同方面表现更好,有些更便宜或延迟更低。此外还涉及到不将所有鸡蛋放在一个篮子里的问题。
"我最近与一些 CIO 交谈,他们正在考虑过去 ERP 时代的供应商锁定问题,"Unisys 全球 AI 实践负责人 Brett Barton 说。"当他们审视自己的应用程序组合时,特别是与云和 AI 能力相关的部分,这个问题成为了首要考虑因素。"
将使用模型多样化而不仅仅依赖单一模型来应对所有用例,意味着公司对任何一个供应商的依赖度更低,并且在环境变化时可以更加灵活。目前,大多数在内部构建 AI 系统的公司倾向于从一个供应商开始,因为同时管理多个供应商要困难得多。但是,随着他们明年建立可扩展架构,拥有"模型花园"——包含各种经过验证、定制和微调的不同规模和功能的系统——将对实现 AI 的最大性能和最高价格效率至关重要。
AWS 全球 ISV 产品管理转型负责人 Jeffrey Hammond 表示,他预计会看到更多公司构建内部平台,为其开发团队提供一套通用服务,包括多模型路由。
"这有助于开发人员快速测试不同的大语言模型,为他们试图自动化的特定任务找到性能、低成本和准确性的最佳组合,"他说。
企业软件的大规模定制
如今,只有最大的公司,拥有最雄厚的财力,才能获得专门为他们开发的定制软件。为小规模用例构建大型系统在经济上是不可行的。
"现在,人们都在使用相同版本的 Teams 或 Slack 或其他类似软件,"安永的 Malhotra 说。"微软不可能只为我制作一个定制版本。"但是,一旦 AI 开始加速软件开发速度并降低成本,这就变得更加可行了。
"想象一下,有一个代理程序观察你工作几周,然后为你设计一个定制桌面,"他说。"公司一直在构建定制软件,但现在 AI 使这一切变得人人都能接触到。我们将开始看到这种情况。能够获得为我量身定制的软件而不必雇人来做,这太棒了。"