Codex Record & Replay 可以把一次桌面操作演示沉淀为可复用 skill,用于后续自动执行类似任务。内容围绕工作原理、启用步骤、Computer Use 等底层能力、适用边界和安全注意事项展开。
AI 编程工具的一次调用不只包含用户输入,还会带上系统指令、工具定义、配置规则和历史消息。掌握 Token 计费、缓存命中、配置加载和会话管理方式,可以显著减少重复消耗。
AI Agent 从演示走向生产,需要一套可重复、可量化、可回归的测评体系。围绕评分器选择、测评维度、用例设计、基线管理、稳定性评估和流水线落地,系统讲清如何搭建 Agent 与 Skill 的工程化测评方案。
Claude Code 的这轮升级重点不在模型“更聪明”,而在命令行 AI 编程智能体是否足够稳定、可观察、可恢复。围绕全屏 TUI、流式输出、可读错误、上下文压缩、MCP 连接和会话自愈,系统梳理这些能力解决了哪些真实开发问题。
Agent 的可靠性不只取决于模型能力,还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。
Qoder Skills 可以把重复的提示词、执行步骤、规范和脚本封装成可复用工作流。掌握它之后,可以让 AI 在 API 开发、设计生成、文档产出、MCP 工具协同等场景中按固定标准执行。
围绕 Harness Engineering 的落地方式,讲清楚如何把评测任务、评测集、评测报告抽象成 AI Agent 可操作的平台能力,让智能体自动生成用例、执行无 UI 与 UI 评测,并基于报告进行多轮系统优化。
code-review-graph 会把代码库预解析为函数、类、调用、依赖组成的结构化图谱,并通过 MCP 提供给 Claude Code 等 AI 编程工具查询。借助影响半径分析和增量索引,它能减少大项目中反复全文读代码带来的 token 浪费。
围绕 AI 编程、Agent 框架、代码库检索、生产故障排查、安全工具和 GPU 内核优化,梳理 13 个 GitHub 开源项目的核心能力、适用场景和使用限制,帮助快速判断哪些工具适合放进自己的开发工作流。