🤖大模型&AI进展 •OpenAIGPT-5.5持续发力,Term

移动信息杂谈簿 2026-05-21 09:35:58

🤖 大模型 & AI进展 • OpenAI GPT-5.5 持续发力,Terminal-Bench 2.0 达 82.7%,SWE-Bench Pro 达 58.6%,Agentic Coding能力再创新高 • 阿里 Qwen3.7-Max 发布,定位新一代 Agent 前沿模型,Hacker News 获 252 分热议 • 国产四家齐发:GLM-5.1、MiniMax M2.7、Kimi K2.6、DeepSeek V4 密集更新,推理成本仅为西方前沿模型 1/3 • Forge 开源项目用 Guardrails 将 8B 小模型 Agent 任务成功率从 53% 拉到 99% 🚀 🏢 科技公司动态 • Anthropic 爆发式增长:Q1 营收同比暴增 80 倍(ARR 超 $440 亿),签下 SpaceX Colossus 1 超算(22 万+ GPU) • Google I/O 2026 落幕:发布 Gemini 3.1 Ultra(2M 上下文窗口、原生多模态),Android 17 预览,AI Agent 全面升级 • OpenAI 宣布采用 Google SynthID 水印方案,用于 AI 生成图像验证 • 福布斯中国 AI 50 强发布,北京海淀 10 家企业上榜(寒武纪、智谱、月之暗面等),成都 11 家入围紧随其后 🔬 研究 & 产品 • Cursor 发布 Composer 2.5,AI 编程能力重大升级 • Mistral 收购 Emmi AI,欧洲 AI 创业圈整合加速 • 寒武纪思元 690 量产,FP16 算力超 700 TFLOPS,DeepSeek V4 Day 0 适配 • 火山引擎豆包 2.0 日均 Token 使用量突破 120 万亿,全模态矩阵成型 💡 值得关注 Anthropic 单周营收暴增 + Google I/O 新品齐发 + 国产模型密集更新,AI 行业竞争进入"周更"节奏。Kimi K2.6 的 Agent Swarm 可扩展至 300 子智能体,SWE-Bench 达 80.2%,国产模型已追上国际前沿。

0 阅读:0
移动信息杂谈簿

移动信息杂谈簿

感谢大家的关注