Harness is the New Dataset:模型智能提升的下一个关键方向网页链接“最近,harness engineering 又成了继 prompt engineering、context engineering 之后新一代的 buzzword。
这背后对应着一个越来越清晰的变化:当基模能力逐渐成熟后,现在真正决定 agent 上限的,已经不是模型本身,而是围绕模型搭建起来的整套系统。
尤其对于模型公司来说,谁更早把 harness 跑顺,谁就更早有机会捕获高质量的执行轨迹;谁能持续捕获这些轨迹,谁就更有可能形成更强的数据飞轮。
Deepmind 的 Staff Engineer Philipp Schmid 甚至直接给出了一个判断:“The Harness is the Dataset. Competitive advantage is now the trajectories your harness captures (Harness 本身就是数据集。现在真正的竞争优势,在于你的 harness 能捕获到怎样的执行轨迹) .”
所以我们最近深入研究了一下这个概念,梳理了 Anthropic、OpenAI、Google 等一线团队的实践经验,也调研了一些身边顶级 agentic engineering 的经验感受,这里分享一些关键的方法论和思考。”How I AI



