德国之声报道:“去年凭借低成本模型在世界一鸣惊人、并迅速跻身行业头部的中国人工智

温不樊人世间 2026-04-25 20:11:09

德国之声报道:“去年凭借低成本模型在世界一鸣惊人、并迅速跻身行业头部的中国人工智能初创公司深度求索 (DeepSeek) 于本周五(4 月 24 日)发布了备受期待的新模型预览版 DeepSeek-V4,同步实现开源,并完成华为昇腾等 8 家国产芯片的原生适配。” 先说说这次 DeepSeek 和华为的联手。圈内人早就看明白了,如今全球人工智能的玩法,骨子里就透着一股 “算力霸权” 的味道。 要搞大模型,就得捏着鼻子交这笔昂贵的 “过路费”。 黄仁勋手里的 CUDA 生态,确实构建了深厚的技术壁垒,全球多数 AI 研发依赖这一生态,但并非 “把全世界的 AI 研究员死死捆绑在一条船上”,国产芯片与生态正快速崛起。 美国那边拔尖的企业,确实常以大规模算力投入提升模型能力,但 “动不动就拿几万张顶配卡去堆算力” 属于夸张表述,顶级大模型训练通常根据需求合理规划算力规模。 以往国内模型厂商对国产芯片往往是 “想用又不敢用”,主要顾虑生态成熟度与适配成本,这就相当于在英伟达的高速公路之外,咱们另起炉灶,蹚出了一条自主可控的新国道。 一条路一旦有人走通了,后面的人跟进就容易得多。 这种底层的软硬件突围,其实是被硬生生逼出来的,西方世界在算力上围追堵截,咱们别无选择,只能搞 “内病外治”,内部结盟来对抗外部封锁。 限制我的硬件,我就用国内最好的硬件配上最能打的算法,其实很多人对大模型有一种误区,总觉得这就是几个极客在实验室里敲代码的产物,现实情况要复杂得多。 欧美大厂可以靠着资本市场支持和供应链优势加大投入,咱们国内的企业如果全靠进口那些天价的显卡,成本压力确实巨大。 部分 AI 初创公司曾面临议价权不足、供应链不稳定的风险,外部限制可能影响项目推进。 DeepSeek 这次的破局思路,跟当年咱们搞两弹一星有点神似。条件有限,那就往死里抠细节。 他们在算法架构上开创了全新的 DSA 稀疏注意力机制,将百万 token 上下文下每 token 算力消耗降至 V3.2 的 27%,KV 缓存占用仅 10%,显著降低了对计算资源的依赖。 现在 DeepSeek 与华为底层技术人员深度协同,完成了从 CUDA 框架到昇腾 CANN 框架的适配优化,把那些不兼容的地方全部趟平,这就等于在干一件极其苦逼但意义深远的基建工作。 只要最头部的模型能在国产芯片上完美运行,后续其他中小企业跟进时,就能直接用这套已经成熟的底层支持,再也不用受制于人。 全球的 AI 产业注定会走向更加多元的生态格局,一边是以美国企业为主导的成熟算力生态,另一边则是咱们正在构建的、以国产芯片为基石的开放普惠生态。 咱们走这条路,起步阶段肯定步履维艰,可是一旦底层生态循环起来,爆发出的势能将是惊人的。 科技的命脉,终究得捏在自己手里,饭碗端在自己手上才最踏实。 参考资料:新华网

0 阅读:0
温不樊人世间

温不樊人世间

感谢大家的关注