大规模 Agent 技能池会带来技能选择困难,名称和描述往往不足以区分相似技能。SkillRouter 通过完整技能 body、双编码器检索、交叉编码器重排序和任务微调,在约 8 万技能池上用 1.2B 参数超过 8B 零样本基线。
AgentCPM-Explore 是基于 Qwen3-4B-thinking-2507 后训练得到的 4B 端侧 Agent 模型,面向长周期、多步交互任务。内容讲清它的能力边界、组件架构、适用场景,以及基于 AgentDock 和 Docker 的部署运行方法。