Multi-Agent Systems

多智能体不是“多开几个模型”而已,而是把有限上下文、有限 token 与有限注意力拆成可协作的并行工作单元。

什么时候值得用

根据 how-we-built-our-multi-agent-research-system,多智能体最适合以下任务:

  • 开放式问题:步骤无法预先写死,要边查边改策略;
  • 可并行探索:存在多条相对独立的搜索路径;
  • 信息量过大:超出单个上下文窗口的有效处理范围;
  • 任务价值高:足以覆盖显著上升的 token 成本。

因此,多智能体不是默认升级选项,而是对“单 agent 的上下文与串行瓶颈”做结构性扩展。

为什么会更强

它的收益主要来自三点:

  • 并行探索:多个 subagent 同时追不同线索;
  • 上下文隔离:每个 agent 有自己的工作集,降低路径依赖;
  • 结果压缩:subagent 先过滤信息,再把高价值结论返回给 lead agent。

从这个角度看,多智能体本质上是在扩展“可用推理容量”,而不只是复制同一个 agent。

常见结构

目前最常见、也最实用的结构是 orchestrator-worker

  • lead / orchestrator 负责拆解问题、分配预算、综合结果;
  • worker / subagent 负责在各自边界内执行探索;
  • 必要时再加入专门的 citation、review 或 evaluator 环节。

这种结构比完全平权的多智能体更容易调试,因为责任分工更清楚。

成功关键不只是模型

多智能体系统的上限通常由下面几件事共同决定:

  • 分工提示是否明确
  • 任务预算是否按复杂度缩放
  • 工具选择与工具描述是否清晰
  • 是否有足够好的可观测性、评估与恢复机制

也就是说,multi-agent 的难点往往不在“再加一个 agent”,而在“如何避免它们重复劳动、互相拖慢、共同失控”。

主要代价

  • token 成本高:并行性几乎总是用成本换性能;
  • 协调复杂度高:分工、同步、去重、回收都更难;
  • 可靠性要求更高:任何单点失败都可能影响整条研究链路;
  • 并非所有领域都适合:如果任务强依赖共享上下文或高度串行,多智能体收益会下降。

一个实用判断句

如果问题不能被自然拆成几条彼此相对独立的工作流,那么它通常还不够适合多智能体。


来源:how-we-built-our-multi-agent-research-system · scaling-managed-agents-decoupling-the-brain-from-the-hands 相关页面:agentic-systems · long-horizon-agents · agent-computer-interface · managed-agents · anthropic