Harness Engineering 关注的是大语言模型外围的运行系统,包括上下文、工具、编排、安全、评估和观测。它决定了 AI Agent 能看到什么、能调用什么、如何规划任务、如何验证结果,以及失败后如何继续改进。
FireRed-Image-Edit 是一个面向复杂指令图像编辑的开源基础模型,重点提升指令遵循、主体一致性、文字编辑、多图参考和画质修复能力。核心设计包括规模化编辑数据引擎、三阶段训练流程,以及面向文字布局的 OCR 奖励机制。
AI 租赁导购需要理解复杂需求、稳定调用商品搜索和知识检索等工具,并把工具结果组织成可信回答。围绕 One-Model + Tool-Use 架构、多阶段强化学习、差异化 GSPO 裁剪以及 MoE 训练推理优化,讲清一套可落地的训练与工程方案。
AgentCPM-Explore 是基于 Qwen3-4B-thinking-2507 后训练得到的 4B 端侧 Agent 模型,面向长周期、多步交互任务。内容讲清它的能力边界、组件架构、适用场景,以及基于 AgentDock 和 Docker 的部署运行方法。
Agentic AI 把大语言模型放进可感知、可行动、可记忆、可验证的闭环系统中。围绕范式演进、Agent Transformer 五元组、单 Agent 与多 Agent 协作、三层学习策略和落地评估,系统拆解构建 AI Agent 时必须理解的关键机制。
MAI-UI 是面向手机、电脑和网页界面的通用 GUI 智能体基座。围绕主动澄清、MCP 工具调用、端云协同和动态环境强化学习,讲清它如何把复杂跨 App 任务拆成更可靠的工具调用与界面操作,并解读 MobileWorld 等评测结果。
大语言模型默认生成自由文本,难以直接接入业务系统。围绕 Prompt 引导、验证修复、约束解码、监督式微调、强化学习和 API 原生结构化能力,讲清结构化输出的原理、实现方式、评估指标和选型思路。
Deep Research 是一种面向开放研究任务的智能体系统,核心能力是自主规划、生成检索问题、探索网页并产出带证据的报告。围绕系统架构、数据构造、奖励设计和强化学习训练流程,梳理从原型实现到可靠性优化的关键技术。