DeepSeekV4最强的地方不是跑分,而是其长上下文时的注意力惊人,这远比跑

利益慢 2026-04-25 00:30:40

DeepSeek V4最强的地方不是跑分,而是其长上下文时的注意力惊人,这远比跑分厉害的多

其1M 59%只比sonnet4.6差一点,GPT和哈基米在这方面连flash-Max都不如

注意力高就不容易出现幻觉,上下文越长AI越容易出现幻觉,这里要严重拷打哈基米3.1,感觉其真实注意力只有64k甚至32k

东大的AI大模型各项性能越来越强,下半年升腾950芯片大规模出货后V4的输出价格还将大幅下降,黄仁勋和美国AI大模型的末日就要来了

DeepSeek v4 百万上下文烽火问鼎计划

0 阅读:33
利益慢

利益慢

感谢大家的关注