OpenClaw,也常被称作“小龙虾”,可以理解成一个可扩展的 AI(人工智能)助手框架。默认情况下,AI 主要负责理解问题和生成回答;装上 SKILL 之后,它就能调用更多工具,例如读取网页、处理 PDF(便携式文档格式)、转写音频、操作 GitHub、访问本地笔记库。
SKILL 的价值不在于“多装几个插件”,而在于把 AI 从单纯聊天变成可执行任务的工作台。一个任务原本可能要在浏览器、文件管理器、PDF 软件、代码仓库、笔记软件之间切换,接入 SKILL 后,可以变成一句自然语言指令。
flowchart LR
U[用户输入自然语言任务] --> O[OpenClaw]
O --> R[判断需要调用哪个 SKILL]
R --> S1[网页读取 / 搜索]
R --> S2[本地文件 / 音视频处理]
R --> S3[PDF / Markdown 转换]
R --> S4[GitHub / Obsidian / 外部服务]
S1 --> O
S2 --> O
S3 --> O
S4 --> O
O --> A[整理结果并返回]
SKILL 一般可以在 ClawHub 找到。安装时最重要的是两件事:一是搞清楚它能访问什么资源,二是确认它是否真的匹配自己的工作流。文件系统、浏览器登录状态、代码仓库、笔记库、API(应用程序编程接口)密钥都属于敏感资源,不能把权限随便交给来路不明的插件。
OpenClaw SKILL 该怎么选
如果只按下载量安装,很容易装出一堆用不到的能力。更实用的方式是按任务类型选:
| 任务类型 | 典型需求 | 推荐 SKILL |
|---|---|---|
| 插件发现 | 不知道该装什么能力 | find-skills |
| 内容理解 | 总结网页、PDF、视频、音频 | summarize |
| 音视频处理 | 语音转文字、提取视频画面 | openai-whisper、video-frames |
| 文档处理 | 修改 PDF、格式转 Markdown | nano-pdf、markdown-converter |
| 图片生成与编辑 | 根据描述生成图、改图 | nano-banana-pro |
| 研发协作 | 查项目、看 Issue、处理 PR、看 CI | github |
| 写作润色 | 减少 AI 腔和模板话 | humanizer |
| 主动助理 | 定时检查、主动提醒、恢复上下文 | proactive-agent |
| 知识库 | 读写 Obsidian Vault | obsidian |
| 长期记忆 | 记录偏好、规则、历史决策 | memory-setup、self-improving |
| 金融分析 | 生成股票技术指标图和报告 | stock-market-pro |
| 安全审查 | 安装陌生插件前检查风险 | skill-vetter |
| 网页抓取 | 读取普通网页、登录页、公众号等内容 | web-content-fetcher |
1. find-skills:让 OpenClaw 自己找插件
用途:根据需求在 ClawHub 里寻找合适的 SKILL。
地址:clawhub.ai/JimLiuxinghai/find-skills
当你只知道自己想完成什么任务,却不知道该装哪个插件时,find-skills 就很有用。比如输入:
我想让 OpenClaw 帮我订阅日历,有没有合适的 SKILL?
或者:
帮我找一个可以搜索 Reddit 内容的 SKILL。
它会去 ClawHub 里匹配相关能力,再把候选插件推荐出来。这个插件适合作为基础工具先装,因为后续扩展能力时可以少翻很多列表。
适合场景:
- 刚开始使用 OpenClaw,不熟悉 SKILL 生态;
- 想找某类能力,但不知道准确插件名;
- 需要比较多个同类插件。
注意点:
- 它负责“发现插件”,不等于替你判断插件一定安全;
- 对涉及文件、账号、网络权限的插件,仍然应该单独审查。
2. summarize:把网页、文件和视频变成摘要
用途:总结网页、PDF、图片、音频、YouTube 视频等内容。
地址:clawhub.ai/steipete/summarize
summarize 解决的是信息过载问题。长网页、研究材料、会议录音、视频链接都可以先交给它提炼主要内容,再决定要不要深入处理。
常见用法:
帮我总结这个链接的核心观点,并列出里面提到的关键数据。
总结这个 PDF,按“背景、方法、结论、风险”四部分输出。
它特别适合做“预处理”:把非结构化内容压缩成结构化信息,让后续分析、写作、归档更容易。
| 输入类型 | 可以得到什么 |
|---|---|
| 网页链接 | 主题、要点、结论、引用信息 |
| PDF 文件 | 章节摘要、关键概念、待确认问题 |
| 音频 / 视频 | 主要内容、时间线、行动项 |
| 图片 | 图片中的文字或视觉信息摘要 |
3. openai-whisper:本地语音转文字
用途:把音频或视频里的语音转成文字。
地址:clawhub.ai/steipete/openai-whisper
openai-whisper 基于 Whisper 语音识别能力,本地运行,不需要额外配置 API key,也不需要把音频上传到远程服务。对于会议录音、采访录音、课程视频、字幕生成这类任务,本地处理有两个好处:成本低,隐私风险也更可控。
典型指令:
把这个会议录音转成文字,并按发言人整理成会议纪要。
从这个视频里提取字幕,再总结成 10 条要点。
适合场景:
- 会议纪要;
- 访谈整理;
- 视频字幕;
- 课程内容归档;
- 不方便上传到外部平台的音频资料。
需要注意的是,本地语音识别会消耗电脑算力,长音频可能需要等待一段时间。如果机器性能较弱,可以先切分音频,再分段转写。
4. nano-pdf:用自然语言修改 PDF
用途:通过对话方式编辑 PDF。
地址:clawhub.ai/steipete/nano-pdf
PDF 往往适合分发和阅读,但不适合直接修改。nano-pdf 把“点菜单、找工具、框选内容”的操作变成自然语言指令,例如:
把第三页标题改成“季度经营分析”。
在第二页末尾追加一段说明:本报告数据截至 2026 年 3 月。
删除第五页的页脚,并保持其他页面不变。
它适合做轻量修改,不一定适合复杂排版设计。遇到合同、报价单、报告这类格式敏感文件,修改后要人工复查版式、分页、字体和内容是否错位。
5. nano-banana-pro:在对话框里生成和编辑图片
用途:根据描述生成图片,也可以基于已有图片继续编辑。
地址:clawhub.ai/steipete/nano-banana-pro
nano-banana-pro 把图片生成能力接入 OpenClaw,支持 1K、2K、4K 分辨率输出,也能对已有图片做二次编辑。常见需求包括换背景、改风格、添加文字、生成海报草图、制作配图方案等。
示例:
生成一张 16:9 的科技博客封面图,主题是 AI Agent 工作流,风格简洁,深色背景。
基于这张图片,把背景换成办公室环境,保留人物主体。
使用时要把要求说具体,尤其是尺寸、比例、风格、主体、文字内容和用途。图片生成类任务很容易因为描述模糊而反复修改,提示词越结构化,返工越少。
6. github:在聊天框里处理 GitHub 工作
用途:搜索开源项目、查看 Issue、处理 PR(Pull Request,代码合并请求)、查询 CI(持续集成)状态。
地址:clawhub.ai/steipete/github
github SKILL 适合把研发协作中的查询类工作搬进对话框。比如:
帮我查一下这个仓库最近打开的高优先级 Issue。
总结这个 PR 改了哪些文件,是否可能影响登录流程。
检查最近一次 CI 失败的原因。
对于开发者来说,最大变化是不用频繁在浏览器、终端、编辑器和聊天窗口之间切换。AI 可以先把仓库信息整理成自然语言,再辅助判断下一步该看哪里。
使用时要注意权限范围。只读查询和写入操作风险不同,如果 SKILL 需要提交评论、创建 Issue、合并 PR,就要确认授权账号和仓库范围。
7. humanizer:减少 AI 生成内容的模板感
用途:改写 AI 生成文本,去掉常见套话。
地址:clawhub.ai/biostartechnology/humanizer
很多 AI 文本会出现固定句式,例如“值得注意的是”“不仅……而且……”“总而言之”等。humanizer 的作用是识别这些模板表达,并替换成更自然的说法。
适合处理:
- 博客初稿;
- 产品说明;
- 邮件草稿;
- 社交媒体内容;
- 客服回复。
一个实用流程是:先让 AI 输出结构完整的草稿,再用 humanizer 做语言层面的清理。它不负责事实校验,改完后仍然要检查数字、引用、技术细节是否准确。
8. proactive-agent:让 AI 从被动回答变成主动协助
用途:让 AI 主动预判需求、定时检查任务、恢复上下文。
地址:clawhub.ai/halthelobster/proactive-agent
大多数 AI 助手默认是“问一句,答一句”。proactive-agent 的目标是让 AI 有一定主动性,例如定期检查你关心的信息、根据上下文提醒可能遗漏的事项,或者在上下文丢失后尝试恢复工作状态。
典型任务:
每天上午检查我关注的项目是否有新的 Release,并汇总变化。
如果我连续处理同一类文档,主动提醒我是否要保存成模板流程。
当任务上下文不完整时,先根据历史记录恢复背景,再继续执行。
主动型插件的关键是边界设置。哪些事情可以自动做,哪些事情必须询问确认,要提前定义清楚。涉及删除文件、提交代码、发送消息、调用付费服务的动作,不适合默认自动执行。
9. obsidian:让 OpenClaw 读写本地知识库
用途:连接 Obsidian Vault,搜索、新建、更新笔记。
地址:clawhub.ai/steipete/obsidian
Obsidian 是很多人用来维护本地知识库的工具。obsidian SKILL 可以让 OpenClaw 直接访问 Vault,把“找笔记、补充笔记、整理链接关系”变成对话指令。
示例:
找一下我关于向量数据库的笔记,并按时间排序。
新建一篇关于 OpenClaw SKILL 的笔记,放到 AI/Tools 目录下。
把这段会议纪要追加到“项目A/周会记录.md”里。
它适合已经有 Obsidian 工作流的人。如果平时不用 Obsidian,单独为了这个 SKILL 建知识库,收益不一定高。使用前要确认 Vault 路径、写入权限和备份策略,避免误改重要笔记。
10. memory-setup:给 AI 配置持久记忆
用途:让 OpenClaw 记住偏好、习惯和长期规则。
地址:clawhub.ai/jrbobbyhansen-pixel/memory-setup
普通对话会话通常是短期的,新的会话不一定知道你之前设定过什么。memory-setup 解决的是长期记忆问题,例如记住你的写作风格、常用目录、项目约定、决策背景等。
可以保存的信息包括:
| 记忆类型 | 示例 |
|---|---|
| 偏好 | 输出 Markdown,不要使用太多表情 |
| 工作习惯 | 代码解释要附带测试方法 |
| 项目规则 | 配置文件放在 config/ 目录 |
| 历史决策 | 某个方案被放弃的原因 |
持久记忆越强,越要重视清理机制。过期偏好、错误结论、临时规则如果长期留存,会影响后续回答。建议定期查看记忆内容,删除不再适用的部分。
11. stock-market-pro:生成股票技术分析图表
用途:根据股票代码生成技术指标图表和分析报告。
地址:clawhub.ai/kys42/stock-market-pro
stock-market-pro 面向股市研究场景,可以生成包含 RSI(相对强弱指标)、MACD(指数平滑异同移动平均线)、布林带等技术指标的图表,并输出分析报告。
示例:
分析 AAPL 最近三个月走势,生成包含 RSI、MACD 和布林带的图表。
对比 TSLA 和 NVDA 的近期技术形态,列出主要支撑位和压力位。
它适合做研究辅助,不适合作为自动交易依据。技术指标只能描述价格和成交量的某些特征,不能保证未来走势。涉及投资决策时,还需要结合基本面、市场环境、风险承受能力等因素。
12. markdown-converter:把各种文件转成 Markdown
用途:把 PDF、Word、PPT、Excel、HTML、图片、音频等格式转成 Markdown。
地址:clawhub.ai/steipete/markdown-converter
AI 更擅长处理结构清晰的文本。很多原始材料分散在不同格式里,直接分析会很麻烦。markdown-converter 的作用是把这些材料统一转换成 Markdown,方便后续总结、检索、改写和归档。
常见流程:
flowchart LR
A[PDF / Word / PPT / Excel / HTML] --> B[markdown-converter]
B --> C[Markdown 文本]
C --> D[总结]
C --> E[问答]
C --> F[知识库归档]
C --> G[二次写作]
适合场景:
- 把客户给的 Word、PPT 转成可分析文本;
- 把网页和 HTML 文档转成知识库资料;
- 把表格内容转换成可读结构;
- 把文件内容交给 AI 做进一步处理。
转换后要检查表格、脚注、图片说明和复杂排版。格式转换不是语义理解,遇到扫描版 PDF 或结构复杂的 PPT,可能需要人工修正。
13. self-improving:把纠错经验沉淀下来
用途:记录 AI 被纠正后的经验,减少同类错误重复出现。
地址:clawhub.ai/ivangdavila/self-improving
self-improving 和 memory-setup 都和记忆有关,但侧重点不同。memory-setup 更像是配置长期偏好和规则,self-improving 更像是从错误中提炼经验。
例如你纠正 AI:
以后写接口文档时,请把错误码单独列成表格,不要混在正文里。
self-improving 可以把这次纠正沉淀成规则,下次遇到类似任务时自动应用。
适合场景:
- 固定格式文档生成;
- 代码风格和项目约定;
- 长期反复出现的纠错点;
- 团队内部规范沉淀。
需要注意的是,自动学习并不总是好事。如果某次纠正只适用于临时任务,却被当成通用规则记住,后续可能产生副作用。因此要给规则加上下文,例如“仅限项目 A”“仅限中文技术博客”“仅限内部周报”。
14. skill-vetter:安装前检查 SKILL 风险
用途:审查陌生 SKILL 的权限、行为和潜在安全问题。
地址:clawhub.ai/spclaudehome/skill-vetter
SKILL 能力越强,越可能接触敏感资源。skill-vetter 适合在安装陌生插件前使用,尤其是插件要求访问文件系统、网络、浏览器状态、账号令牌或代码仓库时。
可以检查的方向包括:
| 检查项 | 需要关注的问题 |
|---|---|
| 权限范围 | 是否要求过多文件或网络权限 |
| 外部请求 | 是否把内容发送到不明地址 |
| 写入行为 | 是否会修改、删除、上传本地文件 |
| 凭证处理 | 是否读取 API key、Cookie、Token |
| 依赖来源 | 是否依赖可疑包或脚本 |
一个稳妥的安装顺序是:先装基础可信插件,再用 skill-vetter 审查其他插件。对于需要高权限的 SKILL,可以先在测试目录或独立环境里试运行。
15. video-frames:从视频中提取关键帧
用途:使用 ffmpeg 从视频里提取关键帧或短片段。
地址:clawhub.ai/steipete/video-frames
video-frames 适合内容分析和视频素材处理。比如要分析一个演示视频的画面变化,或者从视频中截取代表性帧做封面、笔记、报告,都可以交给它完成。
示例:
从这个视频每隔 10 秒提取一帧,并按时间命名。
提取视频中画面变化明显的关键帧,用于内容分析。
截取 00:01:20 到 00:01:45 之间的片段。
它适合处理“从视频里拿素材”的任务,不适合替代专业剪辑软件。需要复杂调色、多轨剪辑、字幕包装时,仍然应该进入视频编辑工具。
补充:web-content-fetcher,用来读取复杂网页
用途:抓取网页正文,并返回干净的 Markdown。
地址:github.com/shirenchuang/web-content-fetcher
web-content-fetcher 解决的是网页读取失败的问题。有些页面用普通抓取方式拿不到正文,例如动态渲染页面、登录后可见页面、微信公众号内容,或者 Jina Reader 读取不完整的页面。它通过多级降级策略兜底,尽量把页面正文提取成适合 AI 处理的 Markdown。
适合场景:
- 抓取普通网页正文;
- 读取需要登录状态的页面;
- 提取微信公众号内容;
- 把网页材料整理进知识库;
- 给 summarize、markdown-converter 等后续处理提供干净输入。
使用登录页面抓取时,要注意账号权限和隐私边界。能读取不代表应该读取,内部系统、付费内容、个人数据都要按授权范围处理。
按工作流组合安装
不同人不需要同一套 SKILL。按工作方式组合,通常比一次装满更合理。
| 使用人群 | 推荐组合 | 能解决的问题 |
|---|---|---|
| 内容创作 | summarize、openai-whisper、video-frames、humanizer、nano-banana-pro | 总结资料、转写音频、提取视频素材、润色文本、生成配图 |
| 研发人员 | github、markdown-converter、summarize、skill-vetter、memory-setup | 查仓库、看 PR、整理技术文档、审查插件、记录项目规则 |
| 知识管理 | obsidian、markdown-converter、summarize、memory-setup、self-improving | 文件转 Markdown、归档笔记、沉淀长期规则 |
| 自动化助理 | proactive-agent、memory-setup、self-improving、find-skills | 主动检查任务、保存偏好、积累纠错经验、发现新能力 |
| 金融研究 | stock-market-pro、summarize、markdown-converter | 技术指标分析、整理研报、归档数据材料 |
如果只想先装一组通用插件,可以从这些开始:
帮我安装这些 SKILL:
find-skills、summarize、openai-whisper、markdown-converter、skill-vetter、memory-setup
这组覆盖了插件发现、内容总结、语音转写、格式转换、安全审查和长期记忆,适合大多数人作为基础配置。
如果主要做内容处理,可以换成:
帮我安装这些 SKILL:
summarize、openai-whisper、video-frames、humanizer、nano-banana-pro、markdown-converter
如果主要做开发协作,可以使用:
帮我安装这些 SKILL:
github、summarize、markdown-converter、skill-vetter、memory-setup、self-improving
安装前的权限检查清单
SKILL 本质上是在给 AI 增加可调用工具。工具越强,越要把权限边界想清楚。
| 问题 | 为什么重要 |
|---|---|
| 它是否需要访问本地文件? | 可能读取或修改私人资料、项目代码 |
| 它是否需要联网? | 可能把输入内容发送到外部服务 |
| 它是否需要账号授权? | GitHub、Obsidian、浏览器登录状态都可能涉及敏感数据 |
| 它是否会写入文件? | 自动修改 PDF、笔记、代码时可能造成误操作 |
| 它是否调用付费服务? | 图片生成、外部 API 可能产生成本 |
| 它是否能自动执行任务? | 主动型插件要限制删除、发送、提交等高风险动作 |
比较稳妥的做法是:高权限插件少装,能只读就不要给写入权限,能限制目录就不要开放整个磁盘。对于陌生 SKILL,先用 skill-vetter 检查,再在低风险环境试运行。
15 个 SKILL 速查表
| # | SKILL | 核心用途 | 更适合谁 |
|---|---|---|---|
| 1 | find-skills | 根据需求发现插件 | 所有 OpenClaw 用户 |
| 2 | summarize | 总结网页、PDF、视频、音频 | 内容处理、资料研究 |
| 3 | openai-whisper | 本地语音转文字 | 会议、访谈、视频字幕 |
| 4 | nano-pdf | 用自然语言修改 PDF | 文档处理 |
| 5 | nano-banana-pro | 生成和编辑图片 | 内容创作、设计草图 |
| 6 | github | 在对话框里操作 GitHub | 开发者 |
| 7 | humanizer | 清理 AI 文本模板感 | 写作、运营、文案 |
| 8 | proactive-agent | 主动检查和提醒 | 自动化工作流 |
| 9 | obsidian | 读写 Obsidian 知识库 | 笔记重度用户 |
| 10 | memory-setup | 配置长期记忆 | 需要稳定偏好的用户 |
| 11 | stock-market-pro | 股票技术指标图和报告 | 金融研究 |
| 12 | markdown-converter | 多格式转 Markdown | 文档整理、知识库 |
| 13 | self-improving | 从纠错中沉淀规则 | 长期重复任务 |
| 14 | skill-vetter | 安装前安全审查 | 所有 OpenClaw 用户 |
| 15 | video-frames | 提取视频关键帧或片段 | 视频分析、内容制作 |
| 补充 | web-content-fetcher | 读取复杂网页并转 Markdown | 网页资料抓取 |
OpenClaw 的 SKILL 系统最适合从小组合开始搭建。先安装能明显减少重复劳动的插件,再根据真实任务逐步扩展;每装一个高权限插件,都要确认它访问什么、修改什么、是否会联网,以及出错时能不能回滚。这样才能把 OpenClaw 用成稳定的工作台,而不是堆满插件的聊天窗口。