中美差距到底有多大?梁文锋毫不避讳、一针见血地回答:“表面上中国 AI 与美国可能仅有一两年的技术代差,但真实的差距是原创和模仿之差。如果这个差距不改变,中国永远只能是追随者,所以有些探索是逃不掉的。” 梁文锋出生于广东湛江吴川一个普通教师家庭,从小在数学上表现出色。2002年,他以全校第一的成绩考入浙江大学电子信息工程专业,2007年继续攻读信息与通信工程硕士,研究方向涉及机器视觉。2008年全球金融危机期间,他与同学开始探索机器学习在全自动量化交易中的应用,通过积累海量行情数据和宏观经济信息,逐步验证算法可靠性,并获得初步收益。 2015年,他正式成立杭州幻方科技有限公司,专注利用AI和数学模型驱动量化投资。公司起步阶段算力有限,但凭借高频策略在市场波动中实现稳定回报。2019年,团队自主研发“萤火一号”平台,投入近2亿元搭载1100块GPU;2021年升级“萤火二号”,投入10亿元配备约1万张A100显卡,管理资产一度突破千亿元,成为国内量化头部机构。这些积累为后续转向通用AI提供了坚实基础。 2023年7月17日,梁文锋将幻方量化的资源转向大模型领域,成立杭州深度求索人工智能基础技术研究有限公司,即DeepSeek。公司团队主要来自北大、清华、北航等本土高校的博士,没有海归背景,全靠国内培养。DeepSeek定位专注基础研究和通用人工智能,强调高效算法创新而非简单应用落地。团队在有限算力下持续深耕底层架构,提出MLA多头潜在注意力和DeepSeekMoESparse稀疏结构等优化,大幅降低计算量和显存占用。这些工作奠定了后续模型高效训练的根基。 2025年1月20日,在北京举行的专家、企业家和教科文卫体等领域代表座谈会上,梁文锋作为受邀嘉宾发言。主持人提问中美AI差距究竟有多大,他直接回应:国内常说有一两年技术差距,但真实差距在于原创与模仿。如果不改变,中国将永远是追随者,前沿探索避不开。他指出,国内许多模型在使用上已很实用,尤其在中文场景和本土需求处理方面表现出色,甚至超过国外产品。这些优势容易让人产生差距不大的错觉。但底层框架和算法大多跟随美国路径:美国提出新架构,国内优化跟进;美国开源基础模型,国内二次开发。这就像拿到现成蓝图盖房子,虽然能盖得更适合本地,但原理和创新源头不是自己的。 梁文锋进一步分析,美国优势在于持续无人区探索,如谷歌AutoML自动生成子模型,斯坦福虚拟实验室让AI自主设计实验方案。这些从零到一的突破构成了核心竞争力。国内更多精力放在应用层,如接入办公、教育、电商等场景,提升日常效率。这些实用创新属于“术”的范畴,在本土化上发挥作用,但距离底层“道”的层面还有距离。如果原创能力长期缺失,一旦外部停止开源或实施限制,整个行业将陷入被动。他强调,中国AI不能永远跟随,必须正视原创不足,敢于投入长期探索。DeepSeek自身坚持开源,公开技术细节,推动行业氛围形成,就是在实践这一理念。 当前行业存在急于求成的现象,部分企业倾向模仿跟进新功能,借助流量和资本快速变现,却不愿砸钱搞基础研究。原创需要数年持续投入,短期难见回报,但突破后才能形成壁垒。DeepSeek的成绩源于底层算法深耕,才在国际基准上匹敌顶级模型。梁文锋的观点提醒大家:不要被表面繁荣迷惑,要清醒认识核心短板;不要走模仿-跟风-变现的老路,而要走探索-试错-突破的新路。中国AI要成为引领者,必须跨越原创这一关,这一关躲不过,只能硬着头皮往前冲。
