DeepSeek V4最强的地方不是跑分,而是其长上下文时的注意力惊人,这远比跑分厉害的多
其1M 59%只比sonnet4.6差一点,GPT和哈基米在这方面连flash-Max都不如
注意力高就不容易出现幻觉,上下文越长AI越容易出现幻觉,这里要严重拷打哈基米3.1,感觉其真实注意力只有64k甚至32k
东大的AI大模型各项性能越来越强,下半年升腾950芯片大规模出货后V4的输出价格还将大幅下降,黄仁勋和美国AI大模型的末日就要来了
DeepSeek v4 百万上下文烽火问鼎计划

DeepSeek V4最强的地方不是跑分,而是其长上下文时的注意力惊人,这远比跑分厉害的多
其1M 59%只比sonnet4.6差一点,GPT和哈基米在这方面连flash-Max都不如
注意力高就不容易出现幻觉,上下文越长AI越容易出现幻觉,这里要严重拷打哈基米3.1,感觉其真实注意力只有64k甚至32k
东大的AI大模型各项性能越来越强,下半年升腾950芯片大规模出货后V4的输出价格还将大幅下降,黄仁勋和美国AI大模型的末日就要来了
DeepSeek v4 百万上下文烽火问鼎计划

猜你喜欢
【4评论】【7点赞】
【18评论】【16点赞】
【10评论】【15点赞】
【1点赞】
【12评论】【27点赞】
【1评论】【4点赞】
作者最新文章
热门分类
军事TOP
军事最新文章