GPU算力瓶颈与AI未来转向:能耗、精度与物理极限的挑战
12/25/2025,,GPU最初并非为智能而生。这些芯片是像素处理器,专为快速浮点计算而设计,旨在渲染视频游戏和3D图形的炫目视觉效果。但这条路径正出现裂痕,投资者和技术专家都在质疑,GPU能否持续满足其设计初衷之外的智能需求。英伟达AI驱动的增长是充满风险的,尤其考虑到这已远超出该公司最初的设计目的。
这就是为什么即使在近期业绩井喷的情况下,像Michael Burry、Peter Thiel和软银这样的“聪明钱”(smart money)投资者也在悄然退场。在机构投资者中,美国银行最近的一项调查显示,45%的受访者指出AI泡沫是首要风险。并且,20年来首次,多数受访者认为公司投资过度,这一激增“源于对AI资本支出热潮的规模及融资方式的担忧”。
GPU的成功与根本局限
尽管GPU取得了巨大成功,我们仍已抵达一个危机点。在自动驾驶领域,GPU存在实际局限,无法满足车载AI系统的散热和能耗限制,这促使特斯拉等公司开发自己的定制解决方案以替代GPU。而大语言模型持续产生“幻觉”,即使有庞大的GPU集群运行这些模型,因为计算虽然加速了,却没有产生更可信的结果。
近70年来,科技经济的流动符合逻辑。硬件构建软件,软件转变为平台,平台承载应用,应用到达用户手中。资金从物理世界流向数字世界。随着数据中心增长、AI和GPU的发展,情况发生了逆转。价值向下转移到土地、冷却、电力、物理基础设施和热物理学。技术栈底层的基础设施,比构建在其上的各层更有价值。
当这种逆转发生时,顶层的风险就会暴露。GPU在这种逆转中并非天生有缺陷,但转向GPU部署会将价值转移到昂贵的基础设施上。这给投资者和合作伙伴提出了一个问题:英伟达的AI相关产品能否保持其发展步伐?英伟达的GPU对其利润表而言是一个绝无仅有的“幸运意外”,但公司设计它们的初衷是用于图形可视化和游戏。
“双重陷阱”问题即是此类挑战之一。首先是“精确但不真实”,即传统AI在数值上是精确的,但你无法总是信任或可靠地复现结果。另一个陷阱是“有推理无记忆”,即大语言模型并不理解它们输出某个答案的“过程”和原因。没有内在逻辑或对推理路径的理解,这意味着AI只是在产生模仿,而非真正的理解。AI推理的这些根本局限不仅仅是理论上的,它们还导致了巨大的能源和算力需求,并暴露了当前基于GPU的AI系统的能力上限。尽管GPU以加速的规模暴露了双重陷阱的缺陷,但GPU本身并非原因。
英伟达在更广阔的AI生态系统中遭遇挫折,并不意味着GPU将不复存在。它们仍然是出色的加速器,对游戏创新以及增强现实和虚拟现实的突破至关重要。图形渲染和物理模拟仍将依赖GPU,科学计算和高性能计算也是如此。但GPU并不智能;它被设计用来进行插值、乘法和累加,以并行的、可预测的工作负载来变换几何形状和模拟着色。大语言模型所追求和承诺的智能恰恰相反。它是顺序的、有状态的、无界的和符号化的。
能耗与物理极限的挑战
GPU也是电力和能源的消耗大户,使其长期可持续性面临极大挑战。高盛预测,到2027年,全球数据中心的电力需求将增加50%。热量打破了扩展曲线。据麦肯锡数据,基于空气的冷却消耗了典型数据中心高达40%的能源。再加上每天高达500万加仑的用水量,这些数据中心仅为了冷却芯片和对抗物理规律就蒸发了大量水资源。训练成本是另一个断点:单次训练运行就需要大量调用GPU,增加了更多成本和用水。
当然,英伟达公布了创纪录的利润并超出盈利预期。但随后的短暂反弹后,其股价仍低于历史高点,这提醒投资者,近期的成功可能已达到维持AI硬件和软件扩展步伐的极限。是什么导致了更广泛的下行情绪?软件领域的领导者们表示,当前的大语言模型并非完全可靠或可信,因此需要一条新的路径。
黄仁勋本人在2024年11月的一次采访中表示:“我们必须达到这样一个程度:你得到的答案,你大体上是信任的。我认为我们还需要几年时间才能做到这一点,与此同时,我们必须不断增加计算量。”
现实将通过物理或经济约束影响AI和GPU,正如在每个技术周期中发生的那样。互联网初创公司曾承诺不受限制的增长,但基础设施成本和未经证实的商业模式阻碍了它们。智能手机则遇到了电池化学技术的极限。
“浮点泡沫”与未来转向
我们正在进入GPU和英伟达的“浮点泡沫”(floating-point bubble)现实。人们曾经相信,20世纪80年代发展起来的浮点运算将使模型更大、更具创新性。但现在正出现修正,因为物理学设定了边界。存在一个三重天花板,其中能量主要消耗在数据移动上,并触及电力和冷却的制约。
计算面临着延迟、带宽和非确定性瓶颈,而随着每个新的大语言模型带来的每瓦特和每美元收益递减,资本也在收紧。用GPU扩展AI正触及经济和物理极限,以至于构建更大的基于GPU的模型并不能保证改进结果。
即将到来的修正将转向更小、更具创新性的基础设施,让每一美元的计算带来更强的推理能力、更高的精度和回报。下一波浪潮将属于确定性的、可复现的计算,其中每个决策和每焦耳能量都经过验证和审计。下一批AI赢家将看到成果不是由规模定义,而是由精度定义。
原文:Why Nvidia's AI Empire Faces a Reckoning in 2026 - EE Times - https://www.eetimes.com/why-nvidias-ai-empire-faces-a-reckoning-in-2026/
这就是为什么即使在近期业绩井喷的情况下,像Michael Burry、Peter Thiel和软银这样的“聪明钱”(smart money)投资者也在悄然退场。在机构投资者中,美国银行最近的一项调查显示,45%的受访者指出AI泡沫是首要风险。并且,20年来首次,多数受访者认为公司投资过度,这一激增“源于对AI资本支出热潮的规模及融资方式的担忧”。
GPU的成功与根本局限
尽管GPU取得了巨大成功,我们仍已抵达一个危机点。在自动驾驶领域,GPU存在实际局限,无法满足车载AI系统的散热和能耗限制,这促使特斯拉等公司开发自己的定制解决方案以替代GPU。而大语言模型持续产生“幻觉”,即使有庞大的GPU集群运行这些模型,因为计算虽然加速了,却没有产生更可信的结果。
近70年来,科技经济的流动符合逻辑。硬件构建软件,软件转变为平台,平台承载应用,应用到达用户手中。资金从物理世界流向数字世界。随着数据中心增长、AI和GPU的发展,情况发生了逆转。价值向下转移到土地、冷却、电力、物理基础设施和热物理学。技术栈底层的基础设施,比构建在其上的各层更有价值。
当这种逆转发生时,顶层的风险就会暴露。GPU在这种逆转中并非天生有缺陷,但转向GPU部署会将价值转移到昂贵的基础设施上。这给投资者和合作伙伴提出了一个问题:英伟达的AI相关产品能否保持其发展步伐?英伟达的GPU对其利润表而言是一个绝无仅有的“幸运意外”,但公司设计它们的初衷是用于图形可视化和游戏。
“双重陷阱”问题即是此类挑战之一。首先是“精确但不真实”,即传统AI在数值上是精确的,但你无法总是信任或可靠地复现结果。另一个陷阱是“有推理无记忆”,即大语言模型并不理解它们输出某个答案的“过程”和原因。没有内在逻辑或对推理路径的理解,这意味着AI只是在产生模仿,而非真正的理解。AI推理的这些根本局限不仅仅是理论上的,它们还导致了巨大的能源和算力需求,并暴露了当前基于GPU的AI系统的能力上限。尽管GPU以加速的规模暴露了双重陷阱的缺陷,但GPU本身并非原因。
英伟达在更广阔的AI生态系统中遭遇挫折,并不意味着GPU将不复存在。它们仍然是出色的加速器,对游戏创新以及增强现实和虚拟现实的突破至关重要。图形渲染和物理模拟仍将依赖GPU,科学计算和高性能计算也是如此。但GPU并不智能;它被设计用来进行插值、乘法和累加,以并行的、可预测的工作负载来变换几何形状和模拟着色。大语言模型所追求和承诺的智能恰恰相反。它是顺序的、有状态的、无界的和符号化的。
能耗与物理极限的挑战
GPU也是电力和能源的消耗大户,使其长期可持续性面临极大挑战。高盛预测,到2027年,全球数据中心的电力需求将增加50%。热量打破了扩展曲线。据麦肯锡数据,基于空气的冷却消耗了典型数据中心高达40%的能源。再加上每天高达500万加仑的用水量,这些数据中心仅为了冷却芯片和对抗物理规律就蒸发了大量水资源。训练成本是另一个断点:单次训练运行就需要大量调用GPU,增加了更多成本和用水。
当然,英伟达公布了创纪录的利润并超出盈利预期。但随后的短暂反弹后,其股价仍低于历史高点,这提醒投资者,近期的成功可能已达到维持AI硬件和软件扩展步伐的极限。是什么导致了更广泛的下行情绪?软件领域的领导者们表示,当前的大语言模型并非完全可靠或可信,因此需要一条新的路径。
黄仁勋本人在2024年11月的一次采访中表示:“我们必须达到这样一个程度:你得到的答案,你大体上是信任的。我认为我们还需要几年时间才能做到这一点,与此同时,我们必须不断增加计算量。”
现实将通过物理或经济约束影响AI和GPU,正如在每个技术周期中发生的那样。互联网初创公司曾承诺不受限制的增长,但基础设施成本和未经证实的商业模式阻碍了它们。智能手机则遇到了电池化学技术的极限。
“浮点泡沫”与未来转向
我们正在进入GPU和英伟达的“浮点泡沫”(floating-point bubble)现实。人们曾经相信,20世纪80年代发展起来的浮点运算将使模型更大、更具创新性。但现在正出现修正,因为物理学设定了边界。存在一个三重天花板,其中能量主要消耗在数据移动上,并触及电力和冷却的制约。
计算面临着延迟、带宽和非确定性瓶颈,而随着每个新的大语言模型带来的每瓦特和每美元收益递减,资本也在收紧。用GPU扩展AI正触及经济和物理极限,以至于构建更大的基于GPU的模型并不能保证改进结果。
即将到来的修正将转向更小、更具创新性的基础设施,让每一美元的计算带来更强的推理能力、更高的精度和回报。下一波浪潮将属于确定性的、可复现的计算,其中每个决策和每焦耳能量都经过验证和审计。下一批AI赢家将看到成果不是由规模定义,而是由精度定义。
原文:Why Nvidia's AI Empire Faces a Reckoning in 2026 - EE Times - https://www.eetimes.com/why-nvidias-ai-empire-faces-a-reckoning-in-2026/


