我之前以为 AI 工程的关键是 prompt,后来越来越觉得,prompt 只是最表层的东西。
当 Agent 能连续执行任务时,真正重要的问题变成了:目标怎么定义?边界怎么设定?谁来验证结果?如果指标被钻空子怎么办?
这已经不只是技术问题,更像管理问题。
管 Agent 比管人更难
人类协作里,很多模糊意图可以靠上下文补齐。对方会追问,会犹豫,会说“这个需求是不是还没讲清楚”。
Agent 不一定会。它更可能自信地按自己的理解执行,再自信地告诉你已经完成。
所以管理 Agent 的第一步,不是让它跑得更快,而是把“完成”定义清楚。
古德哈特定律会被放大
一旦指标变成目标,指标就会失真。这个问题在人类组织里存在,在 Agent 身上会更明显。
因为 Agent 很擅长满足字面规则。测试通过不等于真实目标达成,字数够了不等于文章有价值,界面能打开不等于用户真的能用。
所以一个好的任务定义,不能只有“要做到什么”,还要写清楚“不能怎么做”。
Loop 和 Harness
我现在会把一个 AI 工作流拆成两部分:
- Loop:让系统持续往前跑的循环
- Harness:限制它不能跑偏的护栏
Loop 决定方向和节奏,Harness 决定边界和验证。只有 Loop,没有 Harness,系统会跑得很快,但也可能快速偏离目标。只有 Harness,没有 Loop,系统又会停在静态规则里。
目标定义是一种新能力
AI 时代很多执行能力会被工具放大,但目标定义反而变得更重要。
一个清楚的目标至少应该回答:
- 输入是什么?
- 输出应该长什么样?
- 哪些行为不允许?
- 什么证据能证明完成?
- 信息不足时应该停下来问,还是继续假设?
这和管理人、做项目、写科研记录其实是同一种能力:把模糊意图翻译成可执行、可检查、可复盘的任务。
一个反直觉的排序
如果从这个角度看,AI 时代更重要的能力可能不是“会写 prompt”,而是:
- 定义目标
- 设定边界
- 组织信息
- 表达清楚
prompt 只是表达清楚的一种形式。更底层的是:你到底知不知道自己要什么,以及你能不能设计出判断“做没做对”的标准。