算力差距啊……DeepSeek-V4-Pro 的预训练计算量可粗略估为约 1e25 FLOPs。若拿 OpenAI的 10 万台 GB200 ,哪怕只用约 15% 的平均有效利用率,完成等量计算只需要约 37 小时。
AI创造营How I AI

算力差距啊……DeepSeek-V4-Pro 的预训练计算量可粗略估为约 1e25 FLOPs。若拿 OpenAI的 10 万台 GB200 ,哪怕只用约 15% 的平均有效利用率,完成等量计算只需要约 37 小时。
AI创造营How I AI

猜你喜欢
【1评论】【2点赞】
【2评论】【11点赞】
【3评论】【3点赞】
【18评论】【28点赞】
【1评论】【3点赞】
作者最新文章
热门分类
科技TOP
科技最新文章