专注于开发开源AI原生向量/嵌入数据库的AI初创Chroma发布了

三金笑说商业 2026-03-27 12:36:58

专注于开发开源 AI 原生向量/嵌入数据库的 AI 初创 Chroma 发布了 Context-1 ,一个能自编辑上下文的搜索 Agent:

- 200 亿参数的专用搜索 Agent 模型- 通过 SFT + RL 训练,能在多轮搜索中自主管理上下文- 性能可比肩 GPT-4.5、Claude Opus 等前沿大模型,但成本低、速度快(最高 10 倍推理速度)- Apache 2.0 开源,权重和代码都公开

主要亮点

1. 模型定位

- 20B 参数的专用搜索模型,基于 gpt-oss-20b 训练- 作为"检索子 Agent",只负责找文档,答案生成交给下游大模型

2. 核心创新:自编辑上下文

- 多跳检索(Multi-hop)——将复杂问题分解为子查询,逐步搜索- 自编辑上下文——主动丢弃无关文档,释放上下文窗口空间,避免"上下文腐烂"- 并行工具调用——每轮平均 2.56 次工具调用,比基座模型更高效

3. 训练方法

- 合成了 8000+ 任务(Web、金融、法律、邮件四领域)- 先用大模型(Kimi K2.5)生成 SFT 轨迹- 再用 CISPO 强化学习优化,课程学习策略:先召回→后精确

4. 性能表现

- 多跳检索能力比肩 GPT-4.5、Claude Opus- 速度快 10 倍,成本低得多- 支持 4x 并行推理,融合后效果更佳

简单说:用小型专用模型做搜索,比直接用大模型更省更快,还能自己清理垃圾信息。

论文:www.trychroma.com/research/context-1

0 阅读:2
三金笑说商业

三金笑说商业

感谢大家的关注