国产大模型编程杀到全球第二了 今天凌晨,全球权威AI编程榜单CodeAren

亿点都不科技鸭 2026-05-26 19:21:07

国产大模型编程杀到全球第二了 今天凌晨,全球权威AI编程榜单Code Arena更新排名,阿里最新旗舰Qwen3.7-Max:1541分,仅次于Claude系列,把GPT-5.5、Gemini-3.5-Flash等国际模型甩在了后面! 这还是‌唯一破1540分的国产模型‌,全球总榜排第四,直接把Claude Opus 4.6都比下去了! 给大家科普下这个榜单有多“硬核”: 不是考算法题,而是要从零写出完整可交互的Web应用,开发者匿名PK投票,没法刷榜,比benchmark可信多了,被称为“AI编程界的奥运会”一点不夸张! Qwen3.7-Max到底牛在哪?: 阿里拿它做了个极限测试——在全新发布、连文档都没给全的平头哥真武M890芯片上,从零优化AI推理内核! 连干35小时,调用了1158次工具,做了432次内核评估,从编写、编译到性能分析全自己搞定,最后优化完直接比官方参考实现快了10倍! 这种长周期复杂任务,其他模型可能早就上下文乱套了,但是它30小时之后还能自己主动重构架构,妥妥的能独立干活的程序员。 从3.5到3.7,阿里三个月更三次,现在已经能支持千次工具调用、35小时不崩,再往下发展,真的离“AI自主写项目”不远了,以后小团队一个模型就能搞定开发不是梦? 现在主要通过API开放,想要尝鲜的朋友可以蹲蹲阿里云官方消息!为国产大模型点赞!🎉 国产大模型 AI编程 阿里千问

0 阅读:5
亿点都不科技鸭

亿点都不科技鸭

感谢大家的关注