后端系统要让 AI Agent 安全参与开发、排障和发布,关键是把架构、服务、领域、接口、数据和运行态知识结构化,并用 Harness、测试、权限和 CI/CD 把自动化变成可验证流程。
TencentDB Agent Memory 为 AI Agent 提供长期记忆和短期记忆能力,让智能体能记住用户事实、偏好和任务上下文。围绕它的核心机制、评测数据、接入方式和落地风险,系统讲清 Agent 记忆模块该怎么设计。
以微信步数零点清零和排行榜结算为例,讲清 10 亿级用户系统如何避免全表更新、如何用时间版本号实现逻辑清零、如何处理时钟漂移、排行榜 BigKey 和冷数据归档问题。
Agent 的可靠性不只取决于模型能力,还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。
Claude Code 用在数仓开发时,常见问题是上下文压缩后遗忘约束、SQL 规范执行不稳定、高 token 操作污染主会话。围绕 Harness、Hooks、Subagents、CLAUDE.md 和 SKILL 改造,可以把 AI 编码从临时对话升级为可验证、可持久化、可隔离的研发流水线。
Agent 架构的核心不是提示词技巧,而是状态、控制流和评估器的设计。围绕 Reflection、Tool Use、ReAct、Planning、PEV、多 Agent、记忆、搜索、模拟和安全闸门等 17 种模式,系统拆解它们解决的问题、拓扑结构、适用场景和工程代价。
AI 编程工具已经能生成复杂业务代码,程序员的优势不再是简单地说 AI 做不了什么,而是能定义问题、构建上下文、验证结果、做技术决策并控制 Token 成本。
RAG 系统跑通 Demo 并不难,难点在于把知识库问答调到生产可用。核心问题集中在文档预处理、检索质量调优和效果评估三层,每一层都会直接影响最终回答质量。
vLLM 是面向大语言模型推理的高吞吐服务框架。围绕一次请求从进入系统到流式输出的完整路径,讲清 Prefill、Decode、KV Cache、PagedAttention、连续批处理和调度器之间的关系。