DeepSeek-V4 Flash版和Pro版模型参数,参考V3的参数是671B
DeepSeek-V4-Pro with 1.6T parameters (49B 激活)DeepSeek-V4-Flash with 284B parameters (13B 激活)
但是实际感受下来V4-Flash版的思考模式能力已经超过V3.2思考模式,进步极大!
附图泪目了,什么叫世界顶级AI Lab,而不是一家AI商业公司
DeepSeek v4 百万上下文烽火问鼎计划

DeepSeek-V4 Flash版和Pro版模型参数,参考V3的参数是671B
DeepSeek-V4-Pro with 1.6T parameters (49B 激活)DeepSeek-V4-Flash with 284B parameters (13B 激活)
但是实际感受下来V4-Flash版的思考模式能力已经超过V3.2思考模式,进步极大!
附图泪目了,什么叫世界顶级AI Lab,而不是一家AI商业公司
DeepSeek v4 百万上下文烽火问鼎计划

猜你喜欢
【2评论】【6点赞】
【1评论】【2点赞】
作者最新文章
热门分类
军事TOP
军事最新文章