kaikai's wiki

❯

❯

长程 Agent

2026年4月16日4分钟阅读

Agent
长程任务
上下文管理
运行时

一旦 agent 真要跑到几十轮、几百轮，问题就不再是 prompt 工程够不够精巧，而是你到底有没有在做一套能活过失败、重启和部署变更的系统。

问题本质

how-we-built-our-multi-agent-research-system 和 scaling-managed-agents-decoupling-the-brain-from-the-hands 都指出：一旦 agent 运行时间拉长，系统面对的就不再只是 prompt 质量问题，而是状态、恢复、上下文与部署问题。我越来越觉得，这条分界线就是 demo 和 production 之间真正的断层。

为什么长程会更难

错误会复利：一次工具失败可能把后续整条轨迹带偏；
上下文会溢出：任务跨越数十到数百轮时，窗口必然不够；
部署会打断进行中的会话：线上 agent 不会在发版时自动停下来；
debug 更难：非确定性让“复现一次再看”不再可靠。

记忆层与工作集要分开

最重要的设计原则是：可恢复历史 ≠ 当前上下文窗口。 这句话看起来简单，但它几乎决定了系统后面还能不能被长期维护。

根据 scaling-managed-agents-decoupling-the-brain-from-the-hands，更稳的做法是：

把完整、可回放的事件历史放进 session；
把压缩、裁剪、重排等上下文工程留给 harness；
让 agent 在需要时回读事件，而不是只依赖一次性摘要。

这样做的好处是，未来即使上下文工程策略变化，也不会损坏底层历史。我很喜欢这种分层，因为它接受了一个现实：上下文策略会反复变化，但历史真相层不应该跟着一起漂移。

可靠性模式

在长程任务中，常见的工程模式包括：

checkpoint 与 resume：故障后从上次状态继续；
durable log：把关键事件写入可持久化的会话层；
tool retry + graceful degradation：把失败显式暴露给 agent，由它调整策略；
observability：记录决策模式、工具调用结构与关键转折点；
渐进部署：例如 rainbow deployment，避免一次发版打断全部运行中任务。

与多智能体的关系

多智能体会进一步放大长程问题：

多个 subagent 同时产生状态更新；
lead agent 需要管理预算、同步和综合；
如果切到异步执行，协调成本会继续上升。

因此，越是多智能体，越需要先把长程运行时打牢。否则你只是把一个会丢状态的 agent，放大成一群会丢状态的 agent。

一个实用判断句

如果系统无法优雅地恢复、回放和重读过去发生的事，它就还没有准备好做真正的长程 agent。

来源：how-we-built-our-multi-agent-research-system · scaling-managed-agents-decoupling-the-brain-from-the-hands

相关页面：multi-agent-systems · agentic-systems · managed-agents · anthropic

关系图谱

问题本质
为什么长程会更难
记忆层与工作集要分开
可靠性模式
与多智能体的关系
一个实用判断句

反向链接

Anthropic 公司
Managed Agents 产品
oh-my-openagent
内容目录
整体综述
多智能体研究系统复盘
oh-my-openagent 架构分析
Managed Agents 运行时架构
Agent 计算机接口
Agentic 系统
AI Agent Harness
交互模型
多智能体系统

Created with Quartz v4.5.2 © 2026

GitHub
Discord Community