AI Agent 开发不是把 LLM 接上几个工具就结束了,而是围绕模型建立一套可执行、可观察、可恢复、可评测的工程系统。

一句话定义

AI Agent 是一个能根据目标选择动作、调用工具、读取反馈并继续决策的系统;Agent 开发的重点,是把这个循环约束在可靠的工程边界里。

推荐阅读顺序

  1. Agent开发笔记(1)我第一次手写 Agent Loop 遇到的问题
  2. Agent开发笔记(2)从 Agent Loop 到 Mini Agent Harness
  3. Agent Tracing:理解 Agent 执行过程的可观测性
  4. Agent开发笔记(3)从Agent Eval看为什么llm和harness是共同优化的整体
  5. Agent开发笔记(4)Code Agent 的 Sandbox 和 Tool Permission
  6. Agent开发中的常见问题
  7. Function Calling

核心概念表

概念作用相关问题
Agent Loop让模型在生成、工具调用、观察之间循环什么时候停止,工具错误怎么返回
Tool / Function Calling把模型意图转换为受控的外部能力schema、参数校验、tool choice
Agent Harness包装 loop 的工程运行时trace、replay、错误恢复、安全边界
Tracing记录一次 Agent run 的执行过程哪一步失败,为什么失败
Eval Harness用固定任务集评估改动效果改 prompt、tool schema 后有没有变好
Guardrail在高风险动作前后做约束权限、注入、敏感信息、输出处理

学习路径

先理解最小 Agent Loop,再给它补上工具结果格式、trace、错误恢复和上下文管理。等系统可以稳定复盘后,再引入 eval,用固定任务判断改动是否真的提升了行为。

对于真实应用,安全边界要尽早进入设计。模型可以提出动作意图,但系统必须决定它是否真的有权执行。

延伸阅读