cursor发布Composer2模型技术报告了cursor.com/resources/Composer2.pdf
"Composer 2 主要包含三项工作:持续预训练、强化学习,以及基准测试开发。这三项工作的目标,都是尽可能贴近 Cursor 的实际环境,从而训练出一个高度智能的编程模型。我们展示了持续预训练如何在下游编程性能上带来稳定、持续的提升。
强化学习阶段对最终性能至关重要。我们讨论了在这一阶段所采用的算法。我们发现,简单的方法往往效果最好,而且能带来广泛的性能提升。
我们介绍了内部基准测试 CursorBench,它能更真实地反映编程问题的采样分布。我们也讨论了为什么我们认为,把软件工程师每天都会遇到的复杂问题纳入基准测试非常重要。
我们详细介绍了大规模训练背后的基础设施,包括我们为这个项目开发并开源的内核。我们还讨论了用于强化学习的分布式训练和环境扩展。
感谢 Kimi K2.5、Ray、ThunderKittens、PyTorch 等背后的公司和开源社区。我们也感谢 Fireworks 和 Colfax 的合作与支持。"How I AI


