Step 3.7 Flash 是一款面向生产级 Agent 场景的开源多模态模型,最高生成速度可达 400 TPS。围绕 Agent 链路效率、多模态理解、搜索能力、开源部署和接入方式,讲清它适合解决什么问题以及实际接入时要注意什么。
达尔文 Skill 2.0 通过 9 维评分、多评委独立审查、验证闸门、自动回滚和人工卡口,把 Agent Skill 的迭代变成可重复的工程流程。它适合没有明确 benchmark、但需要长期维护提示词和 workflow 文档的个人开发者场景。
「伯乐」是一个开源 AI 热点聚合 Skill,用来从多个信息源抓取 AI 动态,并通过信息源健康检查、AI 相关性过滤、事件合并和可信度打分,减少重复阅读同一条消息的问题。
Agent 的可靠性不只取决于模型能力,还取决于模型外部的执行环境、工具协议、上下文管理、编排、可观测性、评估和治理。这里用 ETCLOVG 七层架构系统讲清 Harness Engineering 的设计方法和落地检查项。
Agent 架构的核心不是提示词技巧,而是状态、控制流和评估器的设计。围绕 Reflection、Tool Use、ReAct、Planning、PEV、多 Agent、记忆、搜索、模拟和安全闸门等 17 种模式,系统拆解它们解决的问题、拓扑结构、适用场景和工程代价。
Deep Research Agent 要稳定完成多工具协同,不能只依赖通用模型的原生 Function Calling。围绕 FC-SFT 冷启动链路,讲清种子数据构造、Teacher 轨迹生成、质量过滤、防遗忘混合训练和评估闭环。
Harness Engineering 的关键不只是编排 Agent 工作流,更要让团队经验持续沉淀成可复用的知识资产。围绕知识分层、Git 化协作、按需检索、生命周期治理和异步人机协作,讲清 AI 工程交付系统该如何设计知识闭环。
围绕 AI Coding 和生成式内容工作流,梳理 9router、jcode、agentmemory、SuperSplat 等 7 个 GitHub 项目的定位、核心机制、适用场景和上手方式,帮助快速判断哪个工具能解决当前问题。