一句话建起一整个 AI 开发团队?Harness 让 Claude Code 变成了真正的工程平台

先说个真实的痛

你用 Claude Code 写过稍微复杂一点的项目吗?

比如说,一个需要同时处理代码审查、性能优化和功能开发的任务。如果全塞给一个 Agent,它要么上下文爆炸,要么开始来回重复;如果开多个 Session 分别跑,又没法让它们真正协同工作。

我最近在折腾一个数据管道项目,需要同时跑爬虫、数据清洗和 API 对接三个模块。手动切来切去效率很低,就开始琢磨:有没有办法让多个 Agent 像一个真正的团队一样协同工作,而不是各自为战?

然后就找到了 Harness

Harness 是什么

Harness中文 README)是一个 Claude Code 插件,中文叫” 团队架构工厂”。它的核心思路很简单:给它一个业务描述,它帮你自动生成一整套 Agent 团队 —— 包括每个 Agent 的角色定义、技能配置,以及它们之间的协作方式。

打个比方:传统方式是” 你告诉一个人,让他自己协调自己”。Harness 的方式是” 你告诉一个项目经理,让他去安排一整个团队”。

它目前支持 6 种团队架构模式:

模式 适用场景
Pipeline 流水线式,按顺序执行,每个步骤依赖前一步的输出
Fan-out/Fan-in 先分发到多个并行 Agent,再汇总结果
Expert Pool 根据任务类型动态选择最合适的专家 Agent
Producer-Reviewer 一个生成,一个审查,适合质量要求高的任务
Supervisor 一个中央 Agent 做任务分配和调度
Hierarchical Delegation 逐层向下委托,适合大型复杂项目

实操体验:建一个代码审查团队

我用一个实际场景来说明它的使用方式。假设我想建一个代码审查 Agent 团队,需求是:

  • 三个 Agent 分别负责架构审查、安全审查和性能审查
  • 三个 Agent 并行工作,互不依赖
  • 有一个汇总 Agent 整合三份报告,输出最终结论

在 Claude Code 里,我只需要说一句话:

1
2
3
Build a harness for this project. I need an agent team for code review, 
with agents checking architecture, security vulnerabilities, and
performance bottlenecks in parallel, then a supervisor to compile the findings.

然后 Harness 就会自动生成这样的结构:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
your-project/.claude/
├── agents/
│ ├── architect.md # 架构审查 Agent
│ ├── security-reviewer.md # 安全审查 Agent
│ ├── performance-reviewer.md # 性能审查 Agent
│ └── supervisor.md # 汇总 Supervisor Agent
└── skills/
├── review-architecture/
│ └── SKILL.md
├── review-security/
│ └── SKILL.md
├── review-performance/
│ └── SKILL.md
└── compile-report/
└── SKILL.md

每个 Agent 文件里包含了角色定义、行为规范、使用工具和协作接口。你不需要自己写任何东西,Harness 已经把工程化的那套东西帮你搭好了。

为什么这让我兴奋

作为一个经常在咖啡馆、共享办公空间工作的人,我最在意两件事:上下文保持任务并行

Claude Code 本身的 Agent 能力已经很强,但默认情况下它更像一个单兵作战的工具。你可以用 /linter 调起一个子 Agent,可以用 /ask 快速查询,但这些都是在单个 Session 内的轻量协同。

Harness 补上了缺失的那一块 —— 结构化的团队协作层。它把多 Agent 协同从” 我可以想办法实现” 变成了” 开箱即用的工程实践”。

让我真正觉得有价值的是这几点:

第一,降低了多 Agent 系统的工程门槛。 自己配 Agent 团队需要处理角色定义、消息协议、任务分发逻辑,Harness 把这些都封装成了一套可复用的模板。你不需要是 Agent 系统专家,也能用上成熟的团队架构模式。

第二,和 Claude Code 深度集成。 Harness 生成的 Agent 定义和技能文件直接放在 .claude/ 目录下,Claude Code 可以直接识别和调度。你不需要切换到别的工具,不需要配置额外的 API 入口。

第三,六种架构模式覆盖了大多数场景。 简单任务用 Pipeline,复杂任务用 Hierarchical Delegation,审查类任务用 Producer-Reviewer,创意发散类任务用 Expert Pool—— 每种模式都有明确的使用边界。

使用前提和限制

Harness 依赖 Claude Code 的实验性 Agent Teams 功能,使用前需要设置环境变量:

1
export CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

另外,团队协作涉及多个 Agent 并发运行,Token 消耗会比单个 Agent 明显更高。我建议只在任务确实需要并行处理时才启用 Harness,避免用大炮打蚊子。

目前的版本是 1.2.0,功能已经比较稳定,但仍在快速迭代中。如果你在使用中遇到问题,可以去 GitHub 提 Issue,或者加入 Discord 社区。

适合谁用

Harness 适合以下场景:

  • 大型重构或新建项目:架构复杂,多模块需要同时推进,Agent 团队比单 Agent 效率高得多
  • 需要多角度审查的任务:安全、架构、性能三个维度并行审查,比串行快很多
  • 研究类任务:多个 Agent 分别搜索不同来源的信息,Supervisor 汇总结论

不适合的场景:

  • 简单的一次性代码修改任务,直接用 Claude Code 更轻量
  • 没有复杂上下文的长任务,多 Agent 反而增加管理成本

我的实际用法

我现在会把任务先分类:如果是一个模块需要改动,直接让 Claude Code 单 Agent 处理;如果是需要同时考虑多个维度(比如我要给一个服务加新功能,需要同时评估对现有架构的影响、性能和安全性),我会建一个 Harness 团队,让它们并行跑。

最让我惊喜的是 Producer-Reviewer 模式:让一个 Agent 生成方案,另一个 Agent 专门挑毛病。这个模式特别适合我这种经常” 脑子一热就开始写代码” 的人 ——Reviewer Agent 真的能拦住一些事后才发觉的坑。

总结

Harness 解决的不是”Agent 能做什么” 的问题,而是” 多个 Agent 怎么协同” 的问题。它把多 Agent 协作从技术探索变成了可复用的工程实践。对于已经在用 Claude Code 的人来说,这是一个值得尝试的升级 —— 它不会取代你现有的工作方式,但会在某些场景下显著提升你的效率。

如果你感兴趣,可以去 GitHub 仓库看看,文档写得很详细,还支持韩语和日语 README。


你有什么” 多个 Agent 协同工作” 的场景?或者你有什么想让我试着用 Harness 解决的?随时可以聊聊。