美国被彻底震慑?外国记者问到了马斯克:“美国拥有的核弹头可以摧毁世界1000次,难道中国人就一点也不害怕吗?” 2025年1月20日,DeepSeek公司发布R1推理模型。这款模型在数学、编码和逻辑推理等基准测试中达到与OpenAI o1等前沿模型相当的水平,却以极低成本完成训练。早期报道显示,其训练涉及约512块Nvidia H800芯片,总成本远低于西方同类项目动辄数亿美元的投入。消息传出后,硅谷反应强烈,Nvidia股价单日大幅下跌,市值一度蒸发约5930亿美元。市场担忧在于,如果高效路径能以更少资源实现类似性能,那么依赖巨额硬件投资的传统模式可能面临挑战。中国团队通过混合专家系统和优化算法,在有限硬件条件下提升效率,这直接体现了工程执行层面的差异。 这种低成本高性能的突破,并非孤立事件。它与中国的电力产能扩张紧密相关。到2025年底,中国总装机容量达到约3.89太瓦,较上年增长16.1%,新增风电和太阳能容量超过430吉瓦,远超美国同期总新增容量。中国电力消费在2025年首次超过10万亿千瓦时,服务于工业、数据中心和日常需求。可再生能源装机占比持续提升,为计算密集型任务提供了稳定能源基础。在AI训练和推理过程中,电力成本往往占据重要份额,充足供应意味着可以延长训练周期、扩大模型规模,而无需完全依赖进口高端芯片。这一点在实际布局中转化为竞争优势,让本土团队能在外部限制下探索替代路径。 马斯克的回应将核武器话题与当前博弈转向结合。他提到,在人类历史长河中,中国在多数时期都保持技术与组织能力的领先,人才密度和执行力为其提供支撑。DeepSeek的开源特性进一步放大影响,全球开发者能直接访问并基于它进行定制,推理价格也显著低于部分封闭模型。面对芯片出口管制,中国工程师转向架构创新和系统整合,这改变了行业对资源投入的常规假设。从单纯堆叠硬件,转向平衡能源、人才与算法效率的组合。这种转变让竞争从“谁能摧毁世界”逐步转向“谁能定义未来基础设施”。 电力作为底层资源,其规模直接影响AI等高耗能领域的扩张。中国在2025年新增可再生能源容量是美国同类增长的数倍,这为数据中心选址和运行提供了成本可控的选择。相比之下,美国电力系统增长相对平稳,数据中心电力短缺的预测不时出现。DeepSeek R1在发布后迅速登顶应用商店榜单,其在Codeforces等编码任务中的表现,展示了高效路径的可行性。马斯克此前多次在公开场合提及中国工程师的规模,他将DeepSeek视为这一进程的例子,而非例外。 如果把核威慑比作传统拳击规则下的重拳,那么当前竞争更像掌控赛场资源的较量。核弹头曾在特定历史阶段塑造平衡,但进入21世纪,决定长期位置的因素包括电力供应、人才储备和工程迭代速度。中国电力产出已超过美国两倍以上,到2026年这一差距在规划中继续扩大。这为AI全链条运行提供了后备,减少了对单一供应商的依赖。DeepSeek系列的迭代,体现了在限制条件下自我进化的能力,从V3基础模型到R1的强化学习优化,性能提升伴随成本控制。 马斯克的观察源于他对技术趋势的长期跟踪。他没有否认核武器的存在价值,但强调21世纪的权力更多体现在定义未来能力上。中国在工业基础和教育体系上的积累,为人才密度奠定条件。在面对外部技术壁垒时,这种积累转化为本土创新循环。DeepSeek的低成本训练过程,具体体现在使用混合架构减少开销、提高硬件利用率上。这类实践促使行业重新评估AI开发的经济学,推动更多参与者探索高效方法。 峰会后的几个月,DeepSeek团队继续推进模型更新,扩展多模态等应用。中国电力产能按既定节奏扩大,AI基础设施建设稳步进行。马斯克则维持xAI等项目的投入,并在特斯拉相关业务中观察全球整合情况。到当前阶段,双方在技术领域保持各自推进节奏,竞争融入全球供应链的日常运作。没有出现单一事件主导的剧烈转折,而是多维度能力的持续构建。 核武器数量提供了一种威慑框架,但它无法涵盖技术与经济层面的全部动态。DeepSeek的出现提醒人们,实力对比正从静态参数转向动态效率。中国通过电力扩张和工程实践展现的路径,让外界看到历史积累在当代的延续。马斯克的回应,将这一讨论拉回事实层面:人才、基础设施和执行力,正在塑造新的竞争坐标。
