世界杯体彩官网 奈何构建高出99%东说念主的Harness Engineer

自2026岁首以来,对于AI编码的商榷渐渐发生变化。
已往的要点是使用哪个模子、编写什么教唆词以及险阻文不错多长。天然,这些事情仍然很紧要。
关系词,从主要参与者的实践中不错明晰地看出,仅靠这些无法处罚持久、高质地和抓续运行的问题。
轻便六个月前,我仅使用Claude.md运行一个名堂。
要是你写下编码商定、目次结构和时刻栈,AI时常会按预期职责。至少在一开动是这么。
问题在名堂变大后开动出现。
质地各异:即使使用换取的指示"添加API端点",文献放弃和虚假处理细节也可能因会话而异。
会话断开:当你要求他们赓续昨天的职责时,你得到的杀青忽略了以前的接洽决策。
妙技添加失败:在添加了20多个妙技(如/write-test)后,束缚扩充功令和先决条目变得难以束缚。
换句话说,Claude的markdown只不外是一个"肯求"。
莫得机制来检测违法。
莫得机制来真贵规定何时变得落伍。
要是你寄托给他们一个持久任务,一个虚假意味着他们将不得不从新开动。
这里的问题不单是是教唆词的编写容颜。
践诺上,这源于AI智能体运行的环境莫得被正确接洽这一事实。
因此,自2026岁首以来引起保重的一个办法是Harness Engineering。
Harness Engineering是什么?
什么是harness?
Harness是一匹随即一稔的"马具",由缰绳、马鞍和笼头构成——一套无缺的器用,用于辅导一匹重大但不能展望的动物朝着正确的方上前进。
Harness Engineering是什么?
Harness Engineering是对于接洽允许AI智能体褂讪、自主运行的"环境自己"。
就像你用马具放胆马一样,思法是放胆AI并辅导它朝着正确的方上前进!
• AI模子就像马。它们很重大,但不知说念我方要去那处。
• Harness是一套缰绳、马鞍和笼头。它代表辅导AI朝着正确方上前进的环境、拘谨和器用的总数。
左证Michael Hashimoto的说法,方针是"创建一个防护AI智能体失败再次发生的环境"。
我不知说念当前是否有等闲的行业公认术语,但我如故开动称之为"Harness Engineering"。它的理念是,每当你发现智能体犯错时,你花时候计齐截个处罚决策,使智能体遥远不会再犯相同的虚假。
进化的真确体验:
AI智能体放胆如故履历了三个阶段。
咱们将归来每个阶段变得可能的事情和虚浮的东西。
第一阶段:CLAUDE.md时间(教唆词工程,2023岁首)
在名堂根目次放弃一个CLAUDE.md文献,并在其中写入你的时刻栈和编码商定。仅此一项就显贵改善了AI的输出。
CLAUDE.md
时刻栈
• Next.js 15(App Router)
• TypeScript 5.x
• Prisma + PostgreSQL
商定
• 组件必须放在src/components/中
• API路由必须放在src/app/api/中
• 类型界说必须聚会在src/types/中
当前不错作念什么:AI了解时刻栈并生成妥当商定的代码。
虚浮什么:规定只是"肯求"。会话鉴别时先前的险阻文丢失了。当多东说念主开采时,Claude.md的说明因智能体而异。
第二阶段:AGENTS.md时间(险阻文工程)
CLAUDE.md变得太大,世界杯(中国)无法在单个文献中束缚。这导致引入了分手规定的树立.claude/rules/。
AGENTS.md行动跨器用的灵通圭臬开采,是一种声明性描摹智能体指示(读取哪些文献、使用哪些器用等)的机制。
其特色是不依赖于任何特定器用,不错被Claude Code除外的智能体器用援用。
project/
├── CLAUDE.md # 名堂范围的政策(保抓松懈)
├── AGENTS.md # 智能体指示(跨器用圭臬)
└── .claude/
└── rules/
├── architecture.md # 架构拘谨
├── testing.md # 测试政策
└── security.md # 安全要求
当前不错作念什么:规定的保重点分手。咱们不错将智能体援用的险阻文中的信息量放胆在最低必要水平。AGENTS.md允许咱们不管使用什么器用王人能圭臬化对智能体的指示。
虚浮什么:即使规定被写下来,也莫得方针强制扩充它们。会话之间的驰念丢失问题仍然莫得处罚。妙技扩充设施留给智能体,导致质地不一致。
第三阶段:Harness Engineering(2025年底于今)
意志到只是界说规定是不够的,咱们集成了扩充、考据和驰念机制。这即是harness。
Harness不取代险阻文工程;它包含险阻文工程。
CLAUDE.md和AGENTS.md王人是harness的一部分。harness树立在这些层之上:妙技、钩子、驰念和考据轮回。

要是不将这三个办法视为对立的思法,而是行动重见识焦点的移动,就更容易相识它们。
Harness之前和之后
这领会了扩充换取任务"添加用户身份考据API"时有无harness的区别。
之前:仅CLAUDE.md
指示:"杀青用户身份考据API"
鉴别:
• 在src/app/api/auth/route.ts中杀青了JWT身份考据 ← 平常
• 以明文纪录密码 ← 安全违法
• 虚假响应体式与现存API不一致 ← 商定违法
• 未包含测试 ← 未达到圭臬
• 忽略了先前决定使用NextAuth.js进行身份考据的政策 ← 险阻文运动性丢失
在五个托付后果中,只好一个莫得问题。
即便如斯,问题也只是在东说念主工审查时才被发现。
指示:"杀青用户身份考据API"
扩充的放胆:
[驰念] 从progress.md读取先前的决策 → 证据遴荐了NextAuth.js
[妙技] 治服/add-feature职责流,按以下功令杀青:类型界说 → 逻辑 → API → 测试
[钩子] 文献保存时自动使用Biome体式化代码
[钩子] 立即检测console.log语句和安全违范围式
[反馈] 任务完成前运行类型查抄 + 测试 → 0个类型虚假,所有测试通过
[驰念] 更新progress.md用于下次会话
鉴别:
使用NextAuth.js杀青(反馈先前的决策) ← 平常
妥当安全要求 ← 平常
协调虚假响应体式 ← 平常
达到测试隐敝率圭臬 ← 平常
更新经由文献 ← 平常
区别很彰着。莫得harness,操作是"但愿获取好的输出"。有了harness,结构被接洽为"防护差的输出"。
论断
Harness Engineering是为灵验使用AI智能体而接洽环境。
天然教唆词工程是"奈何建议肯求"的艺术,但harness工程是"奈何使其职责"的艺术。
在践诺操纵中,后者的紧要性正在稳步增多。
• 规定由机器强制扩充,而不是通过肯求。
• 驰念应该外部化而不是存储在AI中。
• 接洽时应假定不错复原,而不是假定不会失败。
• 方针是创建团队不错重用的结构,而不是依赖个东说念主的理智贤达。
在AI智能体时间,所需的可能
不是编写更长的教唆词,而是
创建更好的harness。
保重 AI拉呱
要是这篇内容对你有启发,原谅保重「AI拉呱」,获取更多 AI 前沿瞻念察、实战教程与趋势解读。
下期在看
下期将赓续带来该主题的进阶拆解与实操案例世界杯体彩官网,建议先储藏本文,幸免错过更新。