QoderWork 是阿里推出的桌面端 AI Agent（智能体）工作助手。它和普通聊天机器人最大的区别，不在于“能不能回答问题”，而在于它可以围绕一个目标连续执行任务：理解需求、追问细节、调用工具、处理本地文件、生成交付物，并把稳定流程保存成可复用的 Skill。

普通聊天工具更像一个问答窗口，适合解释概念、写一段文案、给出建议；QoderWork 更接近一个桌面工作流执行器，适合处理“有输入文件、有步骤、有产物”的任务，例如整理图片、生成演示文稿、做行程表、解读论文、提取网页内容等。

类型	普通聊天机器人	QoderWork
主要交互方式	问一句答一句	围绕目标连续执行
是否处理本地文件	通常需要手动上传	可在指定工作目录中处理文件
是否生成文件产物	能生成内容，文件能力有限	可生成 PPT、网页、文档、日历等
是否能复用流程	多靠复制提示词	可沉淀为 Skill
适合任务	问答、改写、解释、头脑风暴	文件整理、资料搜集、报告生成、固定流程自动化

它内置 MCP（模型上下文协议，Model Context Protocol）相关能力，并支持 Skills。MCP 可以理解成让模型连接工具、文件和外部能力的一套协议；Skills 则是把某类任务的执行方法封装起来，之后遇到同类任务时可以直接调用。

QoderWork 的核心工作方式

QoderWork 的任务执行一般由四个部分组成：

工作目录：限定 AI 可以处理和保存文件的范围。
对话入口：用户用自然语言描述目标。
工具调用：通过 MCP、内置工具或 Skill 完成搜索、读取文件、生成内容、写入文件等操作。
任务产物：输出重命名后的文件、PPT、网页、文档、日历表等结果。

flowchart LR
    A[用户描述目标] --> B[QoderWork 理解任务]
    B --> C{信息是否足够}
    C -- 不足 --> D[追问细节]
    D --> B
    C -- 足够 --> E[制定执行计划]
    E --> F[调用 MCP / 工具 / Skill]
    F --> G[读取或生成文件]
    G --> H[输出任务产物]
    H --> I{流程是否值得复用}
    I -- 是 --> J[沉淀为 Skill]
    I -- 否 --> K[任务结束]

这个流程有一个关键点：QoderWork 并不是简单把问题丢给大模型生成答案，而是会把任务拆成多个动作。比如“做一个 10 人聚会安排并生成 PPT”，它可能会先确认聚会类型、预算、地点偏好，再搜索资料、整理路线、生成图片素材，最后调用 PPT 相关 Skill 生成文件。

基本上手流程

官网地址：

https://qoder.com/qoderwork

安装并登录后，最重要的一步是选择工作目录。QoderWork 会在这个目录中读取输入文件、处理中间文件，并保存生成结果。

工作目录相当于一个任务沙盒。把任务相关素材都放进去，可以减少误操作范围，也方便之后检查输出结果。

选择目录之后，交互方式就很直接：在对话框里描述任务。如果任务涉及本地素材，例如图片、PDF、网页链接、Skill 文件，可以把它们放到当前工作目录，或者直接拖入对话窗口。

一个比较稳妥的任务描述可以包含这些信息：

目标：我希望你完成什么任务
输入：需要处理哪些文件、链接或资料
输出：希望得到什么格式的结果
约束：预算、时间、地点、风格、字数、命名规则等
确认：执行前如果有不确定信息，请先向我确认

比如：

请整理当前工作目录里的图片文件。

目标：根据每张图片的实际内容重命名文件
输出：保留原始扩展名，文件名使用中文短语
约束：不要删除任何文件；如果识别不确定，在文件名前加“待确认-”
确认：开始改名之前，先列出你计划采用的新旧文件名对照表

这种写法比“帮我整理一下文件”更可靠，因为它明确限制了工作范围、输出规则和风险动作。

任务一：按图片内容整理文件

桌面文件混乱是很典型的 Agent 场景。截图、素材图、下载图堆在一个文件夹里，如果靠人工逐个打开、识别、改名，耗时又容易漏。

可以直接给 QoderWork 一个目标：

请按照图片内容重新命名当前工作目录中的图片文件。

要求：
1. 每个文件名要能概括图片内容
2. 不要改变文件扩展名
3. 不要删除原文件
4. 如果不确定图片内容，用“待确认-”作为文件名前缀

执行时，QoderWork 会逐个查看目录里的图片，并根据图像内容生成新的文件名。任务面板会显示它正在读取哪些文件、做了哪些操作。

这类任务的价值不在于“生成一句回答”，而在于直接改变了文件状态。使用时要特别注意两点：

风险点	建议做法
文件被错误重命名	先要求它生成新旧文件名对照表，确认后再执行
误处理无关目录	只给它一个临时工作目录，不要直接指向桌面根目录或下载根目录
图片内容识别不准	对证件、票据、代码截图等重要文件加“待确认”规则
批量操作难回滚	操作前复制一份备份目录

更安全的流程可以这样设计：

sequenceDiagram
    participant U as 用户
    participant Q as QoderWork
    participant F as 工作目录

    U->>Q: 要求根据图片内容重命名
    Q->>F: 扫描图片文件
    Q-->>U: 输出新旧文件名对照表
    U->>Q: 确认执行
    Q->>F: 批量重命名
    Q-->>U: 返回处理结果和异常文件

把“先预览、再执行”写进提示词，可以明显降低批量文件操作的风险。

任务二：把模糊聚会需求变成可执行方案

“做一个聚会安排”看起来像文案任务，但真正麻烦的是它包含很多隐含条件：人数、年龄段、预算、城市、交通、集合点、活动时长、备选方案、是否需要订位等。

一个不够具体的提示词可能是：

做一个 10 人的聚会活动安排，1 天，并做成 PPT。

如果工具直接开始编内容，产物通常会比较泛。更好的 Agent 应该先追问关键信息，例如：

聚会城市和具体区域
参与者年龄段
人均预算
是否需要室内活动
是否包含正餐
是否需要照顾通勤距离
PPT 面向谁展示

当信息补齐后，QoderWork 可以继续搜索周边店铺、活动场地和路线，再把结果整理成 PPT。

如果需要“拿着就能执行”的行程，提示词要继续加约束：

请把刚才的聚会方案改成具体可执行计划。

地点：武汉江汉路附近
人数：10 人
时间：1 天
要求：
1. 给出集合时间和集合点
2. 每个时间段安排具体活动
3. 推荐具体店铺或地点
4. 给出交通方式和步行时间
5. 列出预算
6. 准备一个雨天或排队过久时的备选方案
7. 输出为 PPT 和一份纯文本行程表

从“泛泛的活动建议”到“可执行计划”，关键是把约束补全。QoderWork 适合承接这类任务，因为它可以把搜索、筛选、排版、生成文件串起来。

flowchart TD
    A[模糊目标：安排聚会] --> B[追问人数、地点、预算、偏好]
    B --> C[搜索场地和活动信息]
    C --> D[筛选路线和时间安排]
    D --> E[生成预算与备选方案]
    E --> F[输出 PPT / 行程表]

任务三：规划旅行并生成日历

旅行规划也是类似逻辑。用户只给出“从武汉出发、去香港玩 4 天、想去迪士尼、预算 5000”，系统需要把目标拆成多个维度：

维度	需要明确的信息
时间	出发日期、返程日期、每天可用时间
交通	出发城市、抵达口岸或机场、城市内交通
景点	必去地点、可选地点、排队时间
餐饮	特色美食、预算、区域
预算	交通、住宿、门票、餐饮、购物预留
安全	单人出行、夜间路线、证件和支付准备
输出	日历、表格、地图路线、备忘清单

可以这样写：

我计划 2 月 20 日左右从武汉出发，去香港玩 4 天，一个人，女生。

偏好：
1. 想去迪士尼
2. 想体验香港特色美食
3. 想打卡经典景点
4. 总预算 5000 元

请帮我规划行程，并生成日历。
要求：
1. 每天按上午、下午、晚上安排
2. 给出交通方式和预计耗时
3. 标注需要提前购买或预约的项目
4. 给出预算拆分
5. 提醒证件、支付、八达通、穿衣等准备事项

这种任务不应该只输出“可以去迪士尼、太平山、尖沙咀”这种列表，而是要输出可执行时间表。QoderWork 如果能把日程做成日历文件或表格，就能直接进入后续使用环节。

任务四：生成教程 PPT

QoderWork 也适合做结构化内容生产，尤其是 PPT（演示文稿）这类需要“资料搜集 + 内容组织 + 页面生成”的任务。

例如让它制作 OpenClaw 教学课程：

请制作一期关于 OpenClaw 的教学课程，并整理成 PPT。

需要包含：
1. 什么是 OpenClaw
2. OpenClaw 可以用来做什么
3. Windows 系统如何配置 OpenClaw
4. 常见问题和排查建议

要求：
1. 面向初学者
2. 每页只讲一个重点
3. 配置步骤要给出命令或操作说明
4. PPT 风格简洁，适合教学演示
5. 生成 PPT 文件，并附一份讲稿大纲

在任务执行过程中，右侧任务监控区会显示它正在搜索资料、生成素材、调用 PPT Skill 或相关工具。

这类任务通常能节省大量“从零搭框架”的时间，但生成的 PPT 仍然需要人工检查：

检查项	为什么要检查
技术步骤	安装命令、环境变量、依赖版本可能变化
页面排版	自动生成 PPT 可能出现文字重叠或布局不齐
图片版权	自动搜索或生成的素材要确认可用范围
术语一致性	同一个技术名词不要在不同页面使用不同译法
受众匹配	面向新手和面向工程师的讲法差异很大

比较推荐的做法是让 QoderWork 同时输出 PPT 和 Markdown 大纲。PPT 用于演示，Markdown 用于快速审稿和二次修改。

任务五：把论文解读流程做成 Skill

Skill 是 QoderWork 值得重点关注的能力。一次性任务完成后，如果发现这套流程以后还会反复使用，就可以把它固化成 Skill。

例如论文解读任务可以这样描述：

请解读当前工作目录中的论文 PDF，并生成一个结构清晰的网页。

网页要求：
1. 使用暗色主题
2. 包含论文基本信息、研究问题、方法、实验、结论、局限性
3. 对核心图表做文字解释
4. 用卡片形式展示关键贡献
5. 给出适合非专业读者阅读的总结
6. 输出 HTML 文件到当前目录

如果生成效果稳定，就可以继续要求：

请把刚才“论文 PDF -> 解读网页”的完整流程做成一个 Skill。

要求：
1. 以后输入任意论文 PDF，都按同样结构生成网页
2. 保持统一的暗色主题
3. 保留“研究问题、方法、实验、结论、局限性”几个固定模块
4. 对不确定内容标注“需要人工确认”

QoderWork 会根据流程确认参数，并生成对应 Skill。

Skill 的作用可以理解成“把一次成功的工作方法保存下来”。以后再处理论文，不需要重新写一长段提示词，也不需要反复强调网页结构、配色和输出格式，直接调用这个 Skill 即可。

flowchart LR
    A[论文 PDF] --> B[论文解读 Skill]
    B --> C[提取论文结构]
    C --> D[总结方法与实验]
    D --> E[生成统一样式网页]
    E --> F[HTML 文件]

适合沉淀为 Skill 的任务一般有三个特点：

特点	示例
输入格式相对稳定	PDF 论文、网页链接、图片文件夹、会议纪要
输出结构固定	解读网页、周报、PPT、表格、文档
会重复执行	每周整理资料、每次读论文、每月做报告

如果任务只做一次，直接对话就够了；如果任务每周都要做，Skill 的价值会更明显。

任务六：使用 Claude Code Skills

QoderWork 还支持 Claude Code Skills。Claude Code 是 Anthropic 面向开发和自动化场景的编码助手，Claude Code Skills 则是一类可复用的能力包。对于已经整理好的 Skill，可以直接拖入 QoderWork 对话框使用。

例如网页内容提取任务：

使用这个 Skill 提取下面网页的正文内容：
https://blog.csdn.net/weixin_49199926/article/details/158069501

要求：
1. 保留章节结构和小标题
2. 去掉广告、侧边栏和无关推荐
3. 输出为 Markdown 文档
4. 保存到当前工作目录

拖入 Skill 后，QoderWork 会按照 Skill 定义的流程处理链接，并把结果保存成文档。

这类能力适合处理网页归档、资料整理、竞品页面分析、技术资料清洗等任务。需要注意的是，网页结构经常变化，Skill 并不能保证所有站点都能稳定提取，遇到登录限制、反爬策略或动态渲染页面时，仍然需要人工介入。

任务七：做热点分析和资料研究

QoderWork 也可以承担资料研究类任务，例如分析 AI 应用近期热点、整理使用技巧、输出行业观察。为了避免泛泛而谈，提示词最好要求它给出来源、分类和判断依据。

请分析最近 AI 应用领域的热点和最新使用技巧。

要求：
1. 按“个人效率工具、企业应用、开发工具、多模态、Agent”分类
2. 每类列出 3 个代表方向
3. 说明为什么这些方向值得关注
4. 给出具体使用技巧，而不是只写趋势判断
5. 标注哪些结论需要进一步核验
6. 输出为一份结构化 Markdown 报告

如果希望分析质量更稳定，可以要求它使用固定框架。比如 COSTAR 和 ICIO 都是常见提示词组织方法：

框架	含义	适合场景
COSTAR	Context、Objective、Style、Tone、Audience、Response	需要明确背景、目标、风格、受众和输出形式的内容任务
ICIO	Instruction、Context、Input、Output	需要清晰描述指令、背景、输入材料和输出格式的任务

研究类任务最容易出现的问题是“说得像真的，但缺少证据”。所以提示词里要明确要求引用来源、区分事实和判断，并标出需要人工核验的地方。

QoderWork 适合什么场景

QoderWork 适合的是多步骤、有产物、可复用的桌面任务。

场景	是否适合	原因
批量整理文件	适合	能读取工作目录并批量处理文件
生成 PPT、文档、网页	适合	可以把资料搜集、结构整理、文件生成串起来
旅行、聚会、活动计划	适合	能通过追问补齐约束，并输出可执行表格
固定格式报告	适合	可以沉淀成 Skill，反复调用
临时问一个概念	一般	普通聊天工具已经足够
高风险系统操作	不适合直接放权	删除文件、改配置、执行脚本前必须人工确认
强实时任务	不一定适合	取决于工具权限、网络状态和数据更新速度
涉及敏感数据的任务	谨慎	需要确认数据处理边界和合规要求

一个简单判断标准是：如果任务只需要一句答案，用聊天工具更轻；如果任务需要“处理材料并生成文件”，QoderWork 更合适。

使用 QoderWork 时容易踩的坑

工作目录不要选太大

不要直接把桌面、下载目录、项目根目录全部交给 AI。更好的方式是为每个任务创建一个临时目录：

qoderwork-tasks/
  paper-reading/
  ppt-openclaw/
  image-rename/
  travel-plan/

这样可以减少误读文件、误改文件的风险，也方便归档任务产物。

批量操作前先要计划

涉及重命名、移动、删除、覆盖写入时，不要让它直接执行。提示词里加一句：

任何会修改、删除、覆盖文件的操作，都必须先列出计划，等我确认后再执行。

这条规则很重要。AI Agent 的执行能力越强，越需要明确操作边界。

模糊目标要补充约束

“帮我做一个 PPT”通常会得到普通结果；“面向初学者、12 页、每页一个重点、包含配置命令、输出 PPT 和讲稿大纲”会稳定很多。

可以使用这个模板：

任务目标：
输入材料：
目标受众：
输出格式：
内容结构：
风格要求：
必须包含：
不要包含：
执行限制：
需要确认的问题：

自动生成的内容要审校

QoderWork 可以完成大量前期工作，但不能替代最终审校。尤其是这些内容必须人工确认：

技术教程中的命令和版本号
旅行计划中的营业时间、票价、交通变化
行业分析中的数据来源
PPT 中的图文排版
涉及预算、合同、法律、医疗等敏感判断的内容

Skill 要维护版本

Skill 不是一次生成就永远不用管。流程变化、输出格式变化、网页结构变化、工具能力变化，都可能让旧 Skill 失效。可以在 Skill 名称或说明里加入版本信息，例如：

paper-reading-webpage-v1
weekly-ai-news-report-v2
web-article-extractor-v1

当输出不符合预期时，不要只改一次对话，应该同步更新 Skill，否则下次还会遇到同样问题。

一个可复制的高质量提示词

下面这个模板适合大多数 QoderWork 任务：

请在当前工作目录中完成以下任务。

【目标】
把这里写清楚：最终要得到什么结果。

【输入】
说明要处理的文件、链接、图片、PDF 或其他资料。

【输出】
说明输出格式，例如 Markdown、PPT、HTML、CSV、日历表等。
说明文件命名规则和保存位置。

【约束】
列出时间、预算、地点、风格、受众、字数、语言等限制。

【执行规则】
1. 如果信息不足，请先提问，不要直接编造。
2. 如果需要修改、删除、覆盖文件，请先给出操作计划，等我确认。
3. 对不确定的信息，请标注“需要人工确认”。
4. 任务完成后，输出处理摘要和生成文件列表。

【是否沉淀为 Skill】
如果这套流程适合重复使用，请给出 Skill 设计建议。

QoderWork 的价值不只是“替人回答问题”，而是把一个含糊目标拆成可执行步骤，并在桌面环境里生成真实产物。用得好的关键不是把所有事情都交给它，而是给它清晰的边界、明确的输出和可复用的流程。

菜单

QoderWork 桌面 AI 助理上手：用 Agent 处理文件、PPT、行程和可复用 Skill