ChatGPT, deepseek 等生成式AI 工具和其他大型语言模型(LLM) 的兴起,引发了新应用的爆炸式增长——实时客户互动、高级分析和决策系统——这些应用需要前所未有的计算能力。训练LLM 并支持其实际应用的计算强度需要大量数据集、超低延迟和可扩展的基础设施。
AI 的增长不是一种趋势,这是我们的世界以及我们对数据中心的看法的根本性转变。有效扩展AI 的能力取决于重新思考为这些系统提供动力的架构和技术。
硅光子学能够以高速传输数据,同时降低功耗,提供了关键的解决方案。然而,与任何变革性技术一样,扩展硅光子学以实现广泛采用需要正面解决几个技术和系统障碍。
多年来,数据中心一直是视频流和电子商务等互联网驱动工作负载的支柱。如今,人工智能应用(尤其是由生成模型驱动的应用)正在颠覆这一角色。人工智能和机器学习的快速发展正在重新定义期望,特别是在带宽、延迟和能源效率方面。
高盛表示,数据中心电力需求预计将以15% 的复合年增长率(CAGR) 增长,而人工智能数据中心的增长将在2023 年至 2030 年期间达到 50% 的复合年增长率。到本世纪末,数据中心预计将占美国总电力消耗的 8%,高于今天的 3%。现有的电气互连无法维持这种轨迹。由硅光子学实现的光互连是唯一可扩展的前进道路。
光学互连提供了一种可持续的方式来处理不断增加的数据量和AI 架构的复杂性。尽管降低成本和扩大生产规模仍面临挑战,但硅光子学的优势(更高的带宽、更低的延迟和更低的功耗)使其成为我们未来基础设施不可或缺的一部分。
扩展硅光子学的挑战
需要重点创新的四个关键领域:
1. 能源效率。随着人工智能工作负载的不断增长,数据中心的功耗正成为一个问题。预测显示,如果不采用新方法,能源使用量可能会呈指数级增长。硅光子学解决了这个问题——与传统解决方案相比,消耗更少的电力和产生更少的热量——但我们可以走得更远。与传统的可插拔解决方案相比,共封装光学器件(CPO) 等创新可将功耗降低多达30%,并且可以将光学元件靠近芯片以最大限度地减少能量损失。然而,硅基调制器在速度和功耗方面仍需改进。
2.制造和封装。精度对于光子学至关重要——大规模对准光学元件是制造的最大挑战之一。当前的流程通常是手动的,不可扩展或不具成本效益。我们需要采用自动化解决方案并改善与其他技术(如图形处理单元(GPU) 和内存单元)的集成,以真正释放硅光子的潜力。
3.生态系统发展。硅光子学并非在真空中运作——要想取得成功,我们需要一个强大的工具生态系统、标准化封装和行业协作。例如,设计工具需要不断发展,以与传统电子产品相同的精度对复杂的光子系统进行建模。
4.成本优化。硅光子学必须价格合理才能得到广泛采用。这意味着提高制造效率并降低材料成本,同时不影响性能。
同时,缩小面积将成为未来十年硅光子学工艺开发的重点。最大的密度限制很少来自设备尺寸;消除串扰的波导之间的间距比实际波导的尺寸大得多。
这只是难题的一块。成功扩展硅光子学需要整个半导体生态系统的协作——从基板供应商到系统集成商等等。通过合作,我们可以应对成本、效率和规模方面的挑战。
硅光子的潜力远远超出改善当前数据中心运营的范围。它能够实现共封装光学器件等创新,可以从根本上重塑人工智能架构。通过减少处理单元和内存单元之间的物理距离,硅光子学可以提高速度、效率和可扩展性。它为实时分析、更先进的AI 模型以及增强现实和自主系统等领域的新应用打开了大门。
部分节选自LaserFocusworld 股票[超话]