#美军对DeepSeek态度矛盾#【多家美媒:DeepSeek让五角大楼喜忧参半

环球网 2025-02-05 08:26:07

#美军对DeepSeek态度矛盾#【多家美媒:DeepSeek让五角大楼喜忧参半】中国人工智能(AI)企业DeepSeek(深度求索)发布的开源大模型在过去一周多时间里火遍全球,它掀起的巨大冲击波不仅让美国科技界深受震动,在AI领域砸下重金的五角大楼也受到波及。多家美国媒体注意到,美军对于DeepSeek的态度充满矛盾:既担心所谓的“个人数据泄露”,也对DeepSeek提出的AI发展新道路感到兴奋。

美军紧急发布禁令

美国“防务一号”网站称,中国DeepSeek推出了开源的生成式大模型,它仅需要耗费OpenAI等美国AI公司训练大模型所用时间和资金的一小部分,就实现了足以匹敌美国顶尖AI模型的效果。DeepSeek的创新引起白宫、华尔街和硅谷的“集体哀号”。美国总统特朗普也宣称“这是我们行业的警钟,我们需要专注于与中国的竞争”。

报道称,基准测试结果表明,DeepSeek的大模型在推理密集型任务中极具竞争力,在数学和编码等领域始终保持顶级性能,但在非推理任务和事实查询准确性方面,与OpenAI最先进的产品仍有明显差距。

即便如此,DeepSeek大模型方便好用和低成本的特性仍获得包括五角大楼工作人员在内的美国各界人士的好评。彭博社援引知情人士的话称,从2024年秋季起,美国军事人员就已开始在工作电脑上下载DeepSeek较早版本的代码。如今DeepSeek大模型大受欢迎之后,美国海军率先发布禁令。随后美国防部信息系统局也采取行动禁止使用该模型。五角大楼宣称,该禁令的原因是DeepSeek大模型的来源和使用涉及所谓的“安全和道德问题”。“防务一号”网站提到,美国军方担心,美国的个人数据广泛泄露本身就是严重的“国家级漏洞”,对手在发生冲突时可能会利用它,“类似DeepSeek这样功能强大的模型激增,可能会使这种趋势变得更糟”。

对于美国针对DeepSeek的各种小动作,中国常驻联合国代表傅聪于北京时间2月4日在纽约联合国总部举行的记者会上表示,“永远不要低估中国科研人员的聪明才智。DeepSeek引发全球轰动和一些人的焦虑恐慌,说明技术遏制和技术限制无法奏效,这是全世界、特别是美国需要学习的一课。”傅聪表示,“我们不需要更多禁令,中美作为在当今AI领域最领先的两个国家,不能不合作。只有共同合作发展,才能弥合数字和智能鸿沟,特别是帮助全球南方在AI发展进程中平等受益。”

移动式核反应堆项目受影响

“防务一号”网站注意到,尽管美国军方以“个人数据泄露”为由限制使用DeepSeek大模型,但后者所开辟出的全新技术路线,对于部署在相对偏远、难以获得稳定网络服务地区的美军而言是一个好消息,它们将在任务中有希望得到强大的AI工具帮助。对于渴望获得最佳AI功能同时还要控制支出的五角大楼来说,也将从中受益匪浅。

美国《防务新闻》网站4日提到,美军近年大力投资AI领域,希望利用AI协助美军提高部署效率。例如美国海军陆战队3日发布的一项修订版航空战略,其重点就是使用自动系统、无人机和AI驱动的软件,“以确保其战斗机群能够在激烈的战区中生存”。但五角大楼官员警告说,美国缺乏支持大规模AI基础设施所需的能源资源和计算能力,“解决这个问题并不容易”。报道提到,尽管美国国防部有一个雄心勃勃的愿景,即在一系列军事任务中使用AI协助数据收集、情报分析、战役和后勤等任务,但根据美国主流的大模型技术路线,运行这些AI程序所需要的海量电力和算力基础设施“超出了五角大楼的能力”。报道提到,美国主流AI大模型所需要的庞大资源,从特朗普政府推动的“星际之门”计划就可见一斑——OpenAI、软银和甲骨文等科技巨头不久前宣布将共同投资5000亿美元,在美国各地建设新的AI基础设施,旨在确保美国在全球AI竞争中的领先地位。

美国防部负责研究和工程的副部长办公室高级计算副主任罗伊·坎贝尔承认,很多时候美军的海外基地不具备训练AI所需的计算能力,“在某些情况下,为了解决前线作战基地无法处理的问题,必须将这些数据传输回美国本土并使用国防部超级计算中心才能得到结果。”这种做法无疑极大降低了效率,而且还对通信稳定提出了很高的要求。

《防务新闻》透露,美军的解决思路之一是发展移动式核反应堆为前线基地的AI大模型提供电力。五角大楼战略能力办公室负责开发移动核反应堆工作的杰夫·瓦克斯曼透露,为应对AI和高功率计算等技术给电网带来的巨大压力,美军于2019年启动了“便携式核反应堆”项目,理论上可以利用核能为AI计算获取稳定的电力供应。但只需要较少芯片和能耗就能匹敌美国顶尖AI模型的DeepSeek突然出现后,西方分析师普遍认为,如果相关技术得到广泛应用,可能会降低AI应用整体电力需求,因此存在较多安全隐患的美军移动式核反应堆的未来发展之路,很可能受到影响。

“美军不需要通用大模型”

“防务一号”网站还提到,DeepSeek的突破提供了构建更高效工具的机会,这同样有利于美军。因为美国主流的“越大越好”的AI大模型发展思路(获得更多训练数据、生成更大的模型、构建更大的数据中心)正在挤压美军真正需要的边缘计算项目。

报道称,美国AI大模型的性能并不一定能证明构建和驱动它们所需的大量资源是合理的。美国国防部正在沿着两条AI技术路径发展:需要大量计算资源的大模型,以及可以在断网时运行于小型平台上的AI。长期以来,美国研究人员将主要注意力投入到通用大模型上,忽视了专业领域的较小型AI模型。但在美军的实际工作中,并不需要通用大模型的复杂功能,主要需求集中在几个特殊领域。

报道举例称,前线部队会面临各种需要AI介入的需求,包括利用AI从无人机或卫星照片数据中筛选特定类型的车辆、解析他们遇到的某种电磁信号特征,甚至只是了解当地的经济、天气、人口或消费者数据,“以便在密集的城市环境中规划更有效和安全的行动”。在这些场景中,美军需要的是依托相对较小数据运行的AI模型,其算力“不需要大量的服务器或GPU作为支持”。相反,由于前线地区情况多变,可能充满敌方电磁干扰,或者是在电力供应不足且通信较弱的前沿小型基地,因此DeepSeek这样只需要相对较少的算力和电力资源的高效工具,其实才更符合五角大楼的需要。

《防务新闻》则提到,针对AI能力不足问题的另一个潜在解决方案是提高处理器的效率。美国海军研究中心空间技术副主任史蒂文·迈尔表示,他带领的团队正在探索使用更高效的神经形态处理器,其效率可比标准处理器高100 倍,“神经形态处理器占用的空间更少,工作速度更快,能耗更低”。(环球时报2月5日文章)

0 阅读:67
环球网

环球网

环球网官方平台。