
关于
设计和优化 AI 代理的动作空间、工具定义和观察格式化,以提高任务完成率。
name: agent-harness-construction description: 设计和优化AI代理的动作空间、工具定义和观察格式化,以提高完成率。 origin: ECC
代理框架构建
当你在改进代理如何规划、调用工具、从错误中恢复以及收敛到完成时,使用此技能。
核心模型
代理输出质量受以下因素约束:
- 动作空间质量
- 观察质量
- 恢复质量
- 上下文预算质量
动作空间设计
- 使用稳定、明确的工具名称。
- 保持输入模式优先且范围窄。
- 返回确定性的输出形状。
- 除非隔离不可能,否则避免万能工具。
粒度规则
- 对高风险操作(部署、迁移、权限)使用微工具。
- 对常见的编辑/读取/搜索循环使用中等工具。
- 仅当往返开销是主要成本时使用宏工具。
观察设计
每个工具响应应包含:
status:success|warning|errorsummary:一行结果next_actions:可操作的后续步骤artifacts:文件路径/ID
错误恢复契约
对于每个错误路径,包含:
- 根因提示
- 安全重试指令
- 明确的停止条件
上下文预算管理
- 保持系统提示最小且不变。
- 将大型指导移入按需加载的技能中。
- 优先引用文件而非内联长文档。
- 在阶段边界压缩,而非任意token阈值。
架构模式指导
- ReAct:最适合路径不确定的探索性任务。
- 函数调用:最适合结构化的确定性流程。
- 混合(推荐):ReAct规划 + 类型化工具执行。
基准测试
跟踪:
- 完成率
- 每个任务的重试次数
- pass@1 和 pass@3
- 每个成功任务的成本
反模式
- 语义重叠的工具过多。
- 不透明的工具输出,没有恢复提示。
- 仅有错误输出,没有后续步骤。
- 用无关引用过载上下文。
兼容工具
Claude CodeCursor
标签
AI与机器学习
