美国的外交电报突然发往全球。白纸黑字只有一句话:警告所有国家,离那个叫DeepSeek的中国模型远点。 就在这份警告信满世界飞的时候,杭州的办公大楼里,DeepSeek的团队甚至连发布会都没开。他们只是在官网上默默更新了一份技术报告,V4预览版直接上线。 这份全球电报来自美国国务院,4月27日前后发到所有驻外使馆。电报内容很直接,要求各国政府和企业谨慎使用DeepSeek模型。美方说这些模型是通过“蒸馏”美国专有AI技术做出来的,存在知识产权和安全风险。 这不是美国第一次针对DeepSeek。3月13日,OpenAI公开致信美国政府,要求禁用DeepSeek,还把全球AI分成所谓“民主AI”和“威权AI”两大阵营。5月1日,美国参议院通过法案,禁止联邦机构使用DeepSeek,并授权国务卿把禁令扩大到盟友。 DeepSeek的总部在杭州,公司名叫深度求索。团队成立时间不长,2023年才组建。核心成员大多是从国内顶尖高校和AI实验室出来的,专注做大模型技术研发。 他们早期目标很明确,做出性能领先又能普惠大众的国产大模型。团队不喜欢高调宣传,更愿意靠技术迭代和开源积累口碑。从V1到V3,每次更新都只在官网发技术报告,不办发布会,不搞大规模宣传。 这次的V4预览版,是4月24日悄悄上线的,比美国的全球警告早了3天。新版分两个版本,V4-Pro是旗舰版,总参数1.6万亿;V4-Flash是轻量版,参数2840亿。 两个版本都支持100万Token的超长上下文,差不多75万个汉字,能一次性处理整部书籍或大型项目文档。底层架构用了全新的混合注意力机制,比传统模型更省算力,效率更高。 团队选择直接开源V4预览版,把模型权重和技术报告全部公开。全球开发者都能免费下载使用,还能参与改进。这种开放做法,和美国一些公司的闭源策略完全不同。 美国口中的“蒸馏”,本是AI行业的通用技术。简单说就是让小模型学习大模型的输出规律,提升能力,谷歌、OpenAI都在用。美方拿这个指责DeepSeek,没有拿出任何实质证据。 斯坦福大学的报告显示,中美顶级AI模型的性能差距已经很小,中国在推理效率和开源生态上还有优势。DeepSeek的模型在部分评测上已经接近国际顶尖闭源模型水平。 美国真正担心的,是DeepSeek走出了独立于美国技术的路。V4已经适配国产昇腾芯片,不再依赖英伟达的CUDA生态。这意味着中国AI有了自主可控的技术底座,不会再被国外芯片和框架卡脖子。 DeepSeek的发展路径和华为很像。都是在技术封锁下,坚持自主研发,慢慢突破关键核心技术。美国打压华为是怕失去5G主导权,现在针对DeepSeek,是怕失去AI领域的霸权。 面对美方的围堵,DeepSeek团队一直很低调。他们没有公开回应警告,只是默默更新技术,优化模型性能。团队知道,最好的回应就是做出更强的技术,让产品在全球市场站稳脚跟。 现在V4预览版已经上线,全球开发者社区反响不错。很多人测试后说,它的长文本处理和代码生成能力,已经达到开源模型的顶尖水平。不少中小企业和开发者开始用它替代部分付费闭源服务。 DeepSeek的目标不只是做一个好用的模型,而是构建一个开放、普惠的AI生态。他们希望让更多人用上顶级AI技术,推动AI在各行各业落地,而不是把技术变成少数公司的垄断工具。 AI竞争从来不是单纯的技术比拼,背后是国家间的科技实力和发展理念的较量。美国想用封锁和警告阻挡中国AI发展,现实是技术潮流和市场需求,从来不会被政治手段左右。 DeepSeek的故事,是中国科技企业坚持自主创新的一个缩影。他们不惹事,但也不怕事,专注做好自己的技术,用实力回应所有质疑和打压。 各位读者你们怎么看?欢迎在评论区讨论。


网友
只要技术人才不作死,不跑国外去。能活的很舒服。在自己的国家做自己的事情绝对是安全的。如果跑国外去是真的相当于找死。