Harness 工作流由 Prompt、规则、技能和模型共同决定,行为天然不稳定,不能只靠体感判断好坏。通过题库、考官、裁判、执行引擎和结果归因,可以建立一套可重复、可回归、可驱动改进的评测闭环。
后端系统要让 AI Agent 安全参与开发、排障和发布,关键是把架构、服务、领域、接口、数据和运行态知识结构化,并用 Harness、测试、权限和 CI/CD 把自动化变成可验证流程。
Claude Code 用在数仓开发时,常见问题是上下文压缩后遗忘约束、SQL 规范执行不稳定、高 token 操作污染主会话。围绕 Harness、Hooks、Subagents、CLAUDE.md 和 SKILL 改造,可以把 AI 编码从临时对话升级为可验证、可持久化、可隔离的研发流水线。
Harness Engineering 关注的不是单次提示词怎么写,而是如何把 AI 编程智能体做成可长期运行的系统。内容覆盖上下文管理、工具权限、Session 事件流、Sandbox 隔离、多智能体协作以及可进化记忆架构。