| 失效链接处理 |
|
Harness-Engineering-橙皮书-最新 下载
转载自:
相关截图:
![]() 主要内容:
OpenAI的定义
2026年2月,OpenAI发布了一篇正式博文,给了harness一个清晰的工程定义:
OpenAI原文:A harness is the tool shell that allows an AI agent to affect the real world. If the reasoning
model is the brain, the harness is the hands and feet. Reading files, fixing code, running tests, deploying
to production: all of it happens inside the harness.
如果模型是大脑,harness就是手和脚。读文件、改代码、跑测试、部署生产,全发生在harness内部。
注意几个细节。
它没说harness是提示词或配置文件,说的是tool shell,一整个壳。不是你告诉AI的那句话,是AI在其中运行的
那个环境。
它也没说harness让AI更聪明。大脑还是那个大脑,harness让大脑能动手。
不是发明,是终于认识到
如果你读完五重含义后的反应是「这不就是给老东西起了个新名字吗」,你说对了一半。
航天工程师60年前就在做类似的事。NASA让飞船自动执行任务,围绕自动化系统设计的约束、反馈循环、冗余
检查、异常处理,和今天说的harness没有本质区别。工业控制领域也一样,PLC编程里的安全联锁机制就是一
种harness。甚至软件测试里的test harness,概念上和AI agent harness完全同构。
AI圈不是发明了harness engineering,是终于意识到自己需要学几十年前就有的工程纪律。
但命名有命名的价值。当一群人各自在做类似的事,没有共同的词来说,经验就传不开。你在写CLAUDE.md,他在写AGENTS.md,
她在配hooks和CI pipeline,做的是同一类工作,但没法高效交流。词出来之后,突然大家都能聊到一起了。
就像Vibe Coding。你可以笑它,但它确实让一种做法变成了可以讨论的东西。
Harness Engineering也一样。价值不在于发明了什么,在于让一群人意识到:自己工作的重心变了。
从写代码变成设计环境,从当执行者变成当架构师,从自己干活变成让AI在你设计的系统里干活。
这个转变已经发生了。只是现在它有了名字。
03 三次命名
第一次命名:Prompt Engineering
2022到2024年,所有人都在学怎么写prompt。
很自然的事。ChatGPT出来了,Copilot出来了,你能用自然语言让AI干活了。问题来了:怎么问才能问到好答
案?
于是有了Prompt Engineering。一门怎么跟AI说话的技术。角色设定、few-shot示例、chain-of-thought引
导,精心选择每个词,因为词的差异直接影响输出质量。
用马具的比喻来说:Prompt Engineering是你对马说的话。向左转。跑快点。别踩花。
管用。但有个根本局限:一次性的、无上下文的、不可复用的。写了一条好prompt,换个场景就得重写。你没
法把一条prompt变成一个系统。
简单任务上够了。但当你需要AI处理真实世界的复杂项目时,一条指令什么都撑不起来。
第二次命名:Context Engineering
2025年6月,两个人几乎同时给了这件事一个名字。
6月18日,Shopify CEO Tobi Lutke发了条推:
Tobi Lutke:Context engineering是为任务提供所有上下文、使其对LLM来说合理可解的艺术。
一周后,Andrej Karpathy背书放大了这个概念:
Karpathy:在每一个工业级LLM应用中,context engineering是精妙的艺术和科学——用恰到好处的信息填充
上下文窗口以完成下一步。
Karpathy特别指出了一个关键区别:人们把prompt联想为短指令,但在严肃的LLM应用中,真正的工作是动态
构建上下文窗口,填入相关文档、对话历史、工具定义和RAG结果。
|


苏公网安备 32061202001004号
