年底的大模型圈,从来不是收官,而是互相加码。就在大家还在消化上一波发布时,谷歌又丢出一个新模型:Gemini 3 Flash。现在 Gemini 的路线已经分得很明白:3 Pro 负责低频但极复杂的深度推理,3 Flash 则是高频、低延迟、偏 Agent 和工程场景的小模型,用来跑大量实时任务。但它不是 Pro 的缩水版,而是另一条线。在 SWE-bench Verified 这类偏真实工程测试里,Gemini 3 Flash 拿到 78%,不仅明显甩开 2.5 系列,在部分工具调用和指令遵循维度,甚至逼近甚至反超 3 Pro。放到更大的战局看,这已经是 GPT vs Gemini 的路线分歧:一边继续堆顶级智能,一边用速度、成本和生态压到默认层。接下来就看谁更受用户欢迎了。你现在更常用谁,GPT 还是 gemini ?



