提示词工程已死?上下文工程过时?


大廠早就进化到了第三阶段:Harness Engineering。
这不是一个新名词,而是 AI 从“玩具”变成“生产力”的必经之路。
👇 拆解 3 大廠核心打法:
1️⃣ 进化论:从“对话”到“系统”
Prompt Eng (1.0): 跟模型聊天,求它写好点。(看天吃饭)
Context Eng (2.0): 管理记忆,压缩上下文,喂 Skill。(精细化喂养)
Harness Eng (3.0): 给模型搭脚手架。评估器、钩子、中间件。(系统级管控)
结论: 以后拼的不是谁的提示词写得花,是谁的“脚手架”搭得稳。
2️⃣ Anthropic 核心打法:运动员≠裁判
痛点: AI 自己写代码自己测,容易“自恋”,觉得没问题其实全是 Bug。
解法: 拆分角色。一个 Agent 负责生成(运动员),另一个 Agent 负责评估和挑刺(裁判)。
效果: 多轮攻防,逼出高质量产出。
3️⃣ OpenAI 反直觉操作:日志是给 AI 看的
痛点: 传统日志给人看,全是废话,AI 读不懂。
解法: 代码仓是 AI 的世界(不在仓里=不存在)。日志必须按 AI 友好格式写,让 AI 自己读日志修 Bug。
结果: 纯 AI 写出百万行代码并投入生产。
4️⃣ LangChain 防偷懒机制:不让 AI 提前下班
痛点: 任务没做完,AI 觉得差不多了,直接返回“完成”。
解法: 加 Hook(钩子)。在结束环节插入检查,任务没达标?发提示词骂回去,让它继续干。
战绩: 仅靠 Harness 技巧,DeepAgent 排名从 30+ 冲进前 5。
💡 心法:怎么学 Harness?
别上来就啃教程,那是“收藏家”干的事。
1.先去用: 下载 Claude Code,买 Plan,凭直觉狂用。
2.去踩坑: 体验 AI 撒谎、偷懒、死循环。不被 AI 气哭过,你不懂为什么要搞 Harness。
3.恍然大悟: 带着痛点回来看 Harness,全是解药。
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
请输入评论内容
请输入评论内容
暂无评论