DeepSeek在DeepSeek-V3.2的技术报告中说,与领先的闭源模

映梦说汽车啊 2025-12-02 23:36:05

DeepSeek 在 DeepSeek-V3.2 的技术报告中说,与领先的闭源模型如 Gemini 3 Pro 比,DeepSeek-V3.2 所掌握的世界知识的广度还有差距,这是因为预训练阶段的算力不足导致的,未来,DeepSeek 计划通过扩大预训练算力规模来缩小差距。这很有趣。在我看来,DeepSeek 是中国最不可能缺算力的公司,以他们的行业地位,想要租到和买到所需算力应该都不难。会不会有一种可能,在发布 R1 后,他们无法再继续用英伟达芯片进行训练了,而国产芯片做推理替代还不错,训练替代就很难。这可能解释了他们在发布 R1 后又陆续发布了几个扎实的工作,但需要更大算力的 V4 和 R2 迟迟没有露面。

0 阅读:11

评论列表

Paradise

Paradise

1
2025-12-03 03:09

因为这是中间过度的版本,不需要浪费太多精力在上面。

映梦说汽车啊

映梦说汽车啊

感谢大家的关注