GPT-5.4在电脑操控基准超越人类:AI自主操作桌面时代正式开启 OpenA

移动信息杂谈簿 2026-04-06 10:09:50

GPT-5.4在电脑操控基准超越人类:AI自主操作桌面时代正式开启 OpenAI于2026年3月5日发布GPT-5.4,这是首个在OSWorld-Verified基准测试中超越人类专家的通用AI模型,得分75.0%,高于人类基准72.4%。该模型具备原生电脑操控能力——无需API支持,可直接通过截图感知、鼠标及键盘指令与桌面软件交互,能处理弹窗、错误提示等意外状态,支持文件管理、浏览器操作、终端命令等全场景任务。历史对比显示进步飞速:GPT-5.2(2025年12月)得分47.3%,GPT-5.3 Codex(2026年2月)为64.7%,不到4个月便完成了从落后到领先的跨越。模型同时提供1M token超长上下文,在财务建模内部基准从68.4%跃升至87.3%。Claude Opus 4.6以72.7%位列第二,Gemini 3.1 Pro约72.5%。定价方面,GPT-5.4标准版输入$2.50/MTok,输出$15.00/MTok,Mini版本则低至$0.20。 来源:Nerd Level Tech、NXCode.io、AlmCorp.com

0 阅读:20
移动信息杂谈簿

移动信息杂谈簿

感谢大家的关注