Harness 工作流由 Prompt、规则、技能和模型共同决定,行为天然不稳定,不能只靠体感判断好坏。通过题库、考官、裁判、执行引擎和结果归因,可以建立一套可重复、可回归、可驱动改进的评测闭环。
Agent Loop 是让大语言模型从一次性文本生成器变成自主行动者的核心结构。围绕感知、推理、规划、行动、观察的循环机制,可以构建能使用工具、处理错误、控制成本并按条件停止的生产级 AI Agent。
TencentDB Agent Memory 为 AI Agent 提供长期记忆和短期记忆能力,让智能体能记住用户事实、偏好和任务上下文。围绕它的核心机制、评测数据、接入方式和落地风险,系统讲清 Agent 记忆模块该怎么设计。
Agentic Engineering 关注如何把 AI Agent 变成可靠的软件工程协作者。核心方法不是让 AI 自由发挥,而是通过结构化上下文、明确分工、分阶段验证和知识沉淀,降低需求到代码过程中的信息损耗。
Agent 的可靠性不只取决于模型能力,还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。
Agent 架构的核心不是提示词技巧,而是状态、控制流和评估器的设计。围绕 Reflection、Tool Use、ReAct、Planning、PEV、多 Agent、记忆、搜索、模拟和安全闸门等 17 种模式,系统拆解它们解决的问题、拓扑结构、适用场景和工程代价。
Agent 运行时的 Token 成本往往来自系统提示词、历史消息、工具调用和重复上下文回放。AgentSight 是 ANOLISA 的可观测组件,可以监控 Agent 状态、追踪 LLM 调用、按会话和对话拆解 Token 消耗,并通过命令行或可视化面板定位成本异常。
围绕 AI Coding 和生成式内容工作流,梳理 9router、jcode、agentmemory、SuperSplat 等 7 个 GitHub 项目的定位、核心机制、适用场景和上手方式,帮助快速判断哪个工具能解决当前问题。
CLAUDE.md 是 Claude Code 的项目级指令文件,可以在每次会话开始时给 AI 编程代理设定行为边界。围绕少假设、少过度设计、少无关修改、用验证目标驱动执行四个方向,可以明显减少 AI 写代码时常见的失控问题。