德国之声报道：“去年凭借低成本模型在世界一鸣惊人、并迅速跻身行业头部的中国人工智

德国之声报道：“去年凭借低成本模型在世界一鸣惊人、并迅速跻身行业头部的中国人工智能初创公司深度求索 (DeepSeek) 于本周五（4 月 24 日）发布了备受期待的新模型预览版 DeepSeek-V4，同步实现开源，并完成华为昇腾等 8 家国产芯片的原生适配。” 先说说这次 DeepSeek 和华为的联手。圈内人早就看明白了，如今全球人工智能的玩法，骨子里就透着一股 “算力霸权” 的味道。要搞大模型，就得捏着鼻子交这笔昂贵的 “过路费”。黄仁勋手里的 CUDA 生态，确实构建了深厚的技术壁垒，全球多数 AI 研发依赖这一生态，但并非 “把全世界的 AI 研究员死死捆绑在一条船上”，国产芯片与生态正快速崛起。美国那边拔尖的企业，确实常以大规模算力投入提升模型能力，但 “动不动就拿几万张顶配卡去堆算力” 属于夸张表述，顶级大模型训练通常根据需求合理规划算力规模。以往国内模型厂商对国产芯片往往是 “想用又不敢用”，主要顾虑生态成熟度与适配成本，这就相当于在英伟达的高速公路之外，咱们另起炉灶，蹚出了一条自主可控的新国道。一条路一旦有人走通了，后面的人跟进就容易得多。这种底层的软硬件突围，其实是被硬生生逼出来的，西方世界在算力上围追堵截，咱们别无选择，只能搞 “内病外治”，内部结盟来对抗外部封锁。限制我的硬件，我就用国内最好的硬件配上最能打的算法，其实很多人对大模型有一种误区，总觉得这就是几个极客在实验室里敲代码的产物，现实情况要复杂得多。欧美大厂可以靠着资本市场支持和供应链优势加大投入，咱们国内的企业如果全靠进口那些天价的显卡，成本压力确实巨大。部分 AI 初创公司曾面临议价权不足、供应链不稳定的风险，外部限制可能影响项目推进。 DeepSeek 这次的破局思路，跟当年咱们搞两弹一星有点神似。条件有限，那就往死里抠细节。他们在算法架构上开创了全新的 DSA 稀疏注意力机制，将百万 token 上下文下每 token 算力消耗降至 V3.2 的 27%，KV 缓存占用仅 10%，显著降低了对计算资源的依赖。现在 DeepSeek 与华为底层技术人员深度协同，完成了从 CUDA 框架到昇腾 CANN 框架的适配优化，把那些不兼容的地方全部趟平，这就等于在干一件极其苦逼但意义深远的基建工作。只要最头部的模型能在国产芯片上完美运行，后续其他中小企业跟进时，就能直接用这套已经成熟的底层支持，再也不用受制于人。全球的 AI 产业注定会走向更加多元的生态格局，一边是以美国企业为主导的成熟算力生态，另一边则是咱们正在构建的、以国产芯片为基石的开放普惠生态。咱们走这条路，起步阶段肯定步履维艰，可是一旦底层生态循环起来，爆发出的势能将是惊人的。科技的命脉，终究得捏在自己手里，饭碗端在自己手上才最踏实。参考资料：新华网

0 阅读：0

德国之声报道：“去年凭借低成本模型在世界一鸣惊人、并迅速跻身行业头部的中国人工智

黄仁勋直言：华为芯片加上DeepSeek，美国怕的不只是丢市场英伟达CEO黄

前DeepSeek研发负责人，多模态技术核心研究员阮翀官宣加入元戎，这也是他

谁能想到，老美满怀期待地把压箱底的宝贝摆上货架，结果咱们连看都不看一眼！4月22

和底层人打交道，有一个秘诀。

一代人有一代人的随礼方式

你有没有想过？为什么当年的西方，要把先进的高铁技术转让给中国？最根本的原因只有一

DeepSeekV4发布碰到了什么问题？国产大模型都在搞什么？DeepSeek

【DeepSeek融资细节DeepSeek融资或为稳定研究团队】当地时间4月