DeepSeek创始人梁文峰再次语出惊人!他说:“我们经常说中国AI和美国有一两

渺远的云娱乐说 2025-10-16 10:51:42

DeepSeek创始人梁文峰再次语出惊人!他说:“我们经常说中国AI和美国有一两年差距,但真实的差距是原创和模仿之差。如果这个不改变,中国永远只能是追随者,所以有些探索也是逃不掉的。” 其实DeepSeek的成长轨迹本身就藏着对这个问题的回应,这家2023年4月才由幻方量化牵头成立的公司,成立之初就撞上美国芯片禁运的高墙。当时主流观点认为,没有顶尖芯片支撑,根本练不出能对标国际的大模型。 OpenAI的GPT-4用了1.8万亿参数,训练数据堆到13万亿token,背后是巨量算力的支撑。 可DeepSeek偏没走寻常路,2024年1月发布的首个大模型DeepSeek LLM,670亿参数规模远不及GPT-4,却在2万亿token的数据集上练出了硬实力。到5月开源第二代MoE大模型时,直接打出了比肩GPT-4 Turbo的性能,价格却压到对方的百分之一,硬生生靠架构算法创新撕开了口子。 梁文峰说的“探索逃不掉”,在自家产品上体现得淋漓尽致,《全球人工智能科研态势报告(2015-2024)》里藏着更本质的答案。这份报告清晰勾勒出中美“双强并立”的格局,却也点破了实力构成的差异。 美国头部企业的科研产出效率透着积累的厚度,谷歌、微软、Meta三大巨头的总发文量达到5896篇,是腾讯、阿里、华为这三家中国企业的1.8倍。 基础研究的差距更刺眼。 美国企业在机器学习、自然语言处理等核心领域的论文,平均每篇能收获63.3次引用,比中国企业同类论文的55次高出15个百分点。这意味着美国在底层理论上的探索,更能引发全球学界的共鸣和跟进,而中国不少研究还停留在对现有理论的应用优化上。 人才结构的差异同样值得深思,全球AI领域Top100人才里,中美占了75个,中国机构就职的学者有55人,数量上占优。但美国那20位学者大多深耕基础理论,而国内不少人才扎堆在应用落地领域。 这种差异不是一天形成的,美国在AI基础研究上几十年的沉淀,不是短期投入就能追平的。 梁文峰那句“过去三十多年IT浪潮里,我们基本没有参与到真正的技术创新里”,戳中了行业痛点。ChatGPT问世后,国内掀起大模型热潮,但很多产品都跳不出美国设定的框架。 规模法则被奉为圭臬,大家一门心思堆参数、扩数据,却很少有人像DeepSeek这样死磕架构创新。 美国的技术封锁反而成了倒逼创新的催化剂。拜登政府2022年开始收紧芯片出口管制,本想卡住中国AI的脖子。可DeepSeek团队硬是在性能稍逊的H800 GPU上练出了好模型,靠的就是算法优化和工程创新。这种“降维”环境下的突破,恰恰印证了原创探索的价值。 2024年11月DeepSeek推出推理模型R1-Lite,12月又上线并开源V3版本,每一步都在摆脱对既有路径的依赖。开源策略更显格局,要知道美国科技巨头正忙着构建技术壁垒,中国企业却在主动开放成果。这种差异背后,是从“跟跑”到“领跑”的心态转变。 行业里总有人盯着短期收益,觉得模仿现成技术来得快、风险小。可梁文峰看得明白,没有原创就没有话语权。美国能制定AI行业标准,靠的就是Transformer架构这类底层创新。中国要是一直停留在模仿阶段,永远只能跟着别人的规则走。 现在的变化正在悄然发生,越来越多企业开始像DeepSeek一样投入基础研究,科技部的“人工智能基础理论专项”也在持续加码。《全球人工智能科研态势报告》显示,中国在AI顶会的原创论文占比正逐年提升,虽然距离美国还有差距,但追赶的脚步从未停歇。 梁文峰的话不是危言耸听,是给行业敲了警钟。AI竞争拼到最后,拼的不是参数规模,不是训练数据量,而是原创能力。那些看似“逃不掉”的探索,恰恰是中国AI摆脱追随者身份的必经之路。DeepSeek的实践已经证明,只要肯沉下心做原创,中国AI完全能走出自己的路。

0 阅读:51

猜你喜欢

渺远的云娱乐说

渺远的云娱乐说

感谢大家的关注