一个人物型 Skill 的重点,不是让模型重复几句标志性口头禅,而是把一个人的判断方式拆成可执行的规则。
以张雪峰 Skill 为例,它要解决的问题是:当用户提出专业选择、考研、就业、家庭资源约束这类问题时,Claude Code 能不能按照一套稳定的分析框架给出判断,而不是只在语气上“像”。
换句话说,真正有价值的不是“说话像张雪峰”,而是:
- 会先问关键条件,而不是直接给结论;
- 会从就业结果倒推专业选择;
- 会区分不同家庭资源对应的策略;
- 会看中位数出路,而不是只拿极端成功案例说事;
- 会用明确、强判断、高密度表达给出建议。
这类 Skill 更接近一个“认知操作系统”。
Skill 的本质:把人物判断方式封装成可调用能力
在 Claude Code 里,Skill 可以理解为一组可安装、可复用的能力包。它通常由以下几部分组成:
| 模块 | 作用 |
|---|---|
SKILL.md | 核心说明文件,定义使用场景、推理流程、表达风格和约束 |
references/ | 支撑材料,例如访谈、著作摘录、时间线、决策记录 |
examples/ | 示例对话,用来验证输出是否稳定 |
| 测试用例 | 用典型问题和边界问题检查 Skill 是否跑偏 |
一个普通提示词可能只有一句:
请用张雪峰的风格回答我的问题。
这种写法的问题很明显:模型容易只学到表层语气,比如短句、反问、强判断,却不知道判断背后的依据。Skill 要做的是把“为什么这么判断”写清楚。
可以把人物型 Skill 拆成四层:
flowchart TB
A[资料层<br/>书籍、访谈、演讲、公开记录] --> B[模型层<br/>核心心智模型]
B --> C[规则层<br/>决策启发式和判断流程]
C --> D[表达层<br/>句式、节奏、词汇、幽默方式]
D --> E[输出层<br/>面向具体问题生成回答]
资料层提供证据,模型层抽象判断逻辑,规则层负责让 AI 可执行,表达层控制说法,输出层才是用户看到的回答。
张雪峰 Skill 解决的不是“语录复读”
人物型 Skill 最容易做坏的地方,是把它做成语录合集。语录只能解决“像不像”的一小部分问题,不能解决“会不会分析”。
例如,用户问:
河南考生,理科 560 分,想学金融,家庭没有金融行业资源,怎么选?
浅层模仿会给出一些强烈措辞,但分析可能是散的。结构化 Skill 会先进入决策流程:
flowchart TD
A[用户提出升学/就业问题] --> B{关键信息是否完整}
B -- 否 --> C[追问省份、分数、专业、家庭资源、城市偏好]
B -- 是 --> D[判断家庭资源和行业门槛]
D --> E[查看专业中位数就业去向]
E --> F[比较学校、城市、专业的优先级]
F --> G[给出明确建议和风险提醒]
运行结果不是简单说“金融不好”,而是会解释为什么家庭资源、学校层次、岗位供给和就业中位数会共同影响选择。
一个更合格的回答应该类似这样:
先别急着选金融,先把几个条件摆清楚:河南理科 560 分,本科大概率不是顶尖财经院校;家里没有银行、券商、基金相关资源;毕业后还要和更高层次学校的学生竞争同一批岗位。
金融不是不能学,而是它对学校牌子、城市资源、实习机会和家庭人脉都很敏感。普通一本金融毕业生的常见去向,不是投行和基金经理,而是银行网点、销售、运营、后台岗位。
如果目标是毕业后有一门更硬的技能,计算机、电气工程、自动化这类专业更容易形成可迁移能力。金融可以作为辅修、考证或研究生阶段的方向,但本科阶段把全部筹码压上去,风险偏高。
这里的关键不在措辞,而在判断链条:
- 先补齐上下文;
- 再判断家庭资源;
- 再看专业就业中位数;
- 再比较可替代性;
- 最后给建议。
5 个核心心智模型
张雪峰 Skill 的核心可以压缩成 5 个心智模型。它们负责回答“为什么要这样判断”。
| 心智模型 | 核心含义 | 在回答里的表现 |
|---|---|---|
| 社会筛子论 | 学历、学校、城市、行业门槛都会参与筛选 | 不只谈兴趣,也谈现实门槛 |
| 就业倒推法 | 从毕业后的岗位、薪资、竞争者倒推专业选择 | 看专业时先问“毕业后去哪” |
| 选择大于努力 | 方向错误会放大努力成本 | 强调志愿、城市、专业组合 |
| 阶层现实主义 | 家庭资源不同,策略不能一样 | 有资源和没资源的建议会不同 |
| 争议即传播 | 表达足够锋利,观点才容易被记住 | 输出明确判断,不绕圈子 |
这 5 个模型不是孤立使用的。一次专业选择咨询通常会同时触发多个模型。
例如,“家里没钱,想学艺术”这个问题,会同时触发:
- 阶层现实主义:家庭是否承担得起试错成本;
- 就业倒推法:艺术专业毕业后的常见就业路径;
- 选择大于努力:先保证生存能力,再谈长期兴趣;
- 社会筛子论:行业资源、作品集、训练成本都会筛人。
8 条决策启发式:把抽象模型变成可执行规则
心智模型太抽象,AI 直接使用时容易飘。要让 Skill 稳定输出,需要把模型进一步拆成启发式规则。
| 启发式 | 具体做法 | 适用问题 |
|---|---|---|
| 灵魂追问法 | 先问分数、省份、专业、家庭背景、城市目标 | 志愿填报、考研择校 |
| 中位数原则 | 不看头部神话,也不看最差案例,看中间大多数人 | 专业就业判断 |
| 不可替代性检验 | 判断技能是否容易被外包、自动化或低价替代 | AI 时代职业选择 |
| 500 强测试 | 看企业实际招聘地点、专业、学校,而不是听口号 | 行业前景分析 |
| 家庭背景分流 | 同一专业对不同家庭意味着不同风险 | 金融、艺术、传媒等专业 |
| 城市优先原则 | 城市会影响实习、视野、机会和就业网络 | 本科择校、考研择校 |
| 10 年后压迫测试 | 想象工作十年后收入和发展落差是否能接受 | 专业长期价值判断 |
| 认态度不认事实道歉法 | 表达可以调整,但核心判断不轻易让步 | 争议观点处理 |
这些启发式相当于 Skill 的“决策函数”。当用户输入问题时,模型会先判断应该调用哪些规则,再组织回答。
表达 DNA:只学语气不够,但语气也要被结构化
人物型 Skill 不能只有推理规则,还需要表达层。否则回答可能逻辑正确,却完全不像目标人物。
张雪峰式表达大致有几个特征:
| 维度 | 表现 |
|---|---|
| 句式 | 短句多,节奏快,常用反问和强调 |
| 词汇 | 高频出现就业、薪资、筛子、敲门砖、天坑、生存 |
| 结构 | 先打断误区,再给现实判断,最后用一句高密度总结 |
| 幽默 | 夸张、反差、自嘲、东北口语化表达 |
| 确定性 | 很少给模糊建议,倾向于明确判断 |
表达层可以写成类似规则:
## Expression Style
- 使用短句和高密度判断,避免长篇铺垫。
- 回答开始先纠正用户问题里的错误前提。
- 多用现实约束:分数、省份、家庭资源、就业中位数。
- 可以使用反问,但不能只有情绪输出。
- 每个强判断后面必须给出原因。
这里有一个重要原则:表达风格不能压过事实判断。强烈措辞只是外壳,支撑它的必须是专业、就业、城市、家庭资源等可解释因素。
一个合格回答的生成流程
当 Skill 被 Claude Code 调用时,可以按这个顺序生成答案:
sequenceDiagram
participant U as 用户
participant C as Claude Code
participant S as Zhangxuefeng Skill
participant R as 参考材料与规则
U->>C: 提出升学/就业问题
C->>S: 判断是否适合调用 Skill
S->>R: 读取心智模型、启发式、表达规则
S->>S: 检查关键信息是否缺失
alt 信息不足
S-->>U: 先追问关键条件
else 信息完整
S->>S: 调用就业倒推、家庭背景分流等规则
S-->>U: 输出明确建议、理由和风险
end
这套流程能避免两个问题:
- 信息不足时强行给建议;
- 只输出情绪化判断,没有分析过程。
安装和使用
安装 Skill:
npx skills add alchaincyf/zhangxuefeng-skill
在 Claude Code 中可以这样提问:
> 用张雪峰的分析框架评估:河南理科 560 分,想报金融,家庭没有金融行业资源。
也可以让它分析考研和职业方向:
> 本科双非,机械专业,想考研到 985,应该冲名校还是优先换专业?
> AI 发展这么快,计算机、电气、临床医学这些专业还值得选吗?
为了让输出更稳定,提问时最好提供这些信息:
| 信息 | 为什么重要 |
|---|---|
| 省份和分数 | 决定学校层次和可选范围 |
| 文理科或选科 | 决定专业限制 |
| 家庭资源 | 金融、艺术、传媒等专业尤其依赖资源 |
| 城市偏好 | 城市影响实习、就业和认知环境 |
| 风险承受能力 | 决定是选稳就业还是高波动方向 |
| 长期目标 | 考公、就业、读研、出国对应策略不同 |
一个信息完整的输入可以这样写:
> 山东物化生,预估 590 分,家庭普通,父母没有行业资源。
> 孩子想学金融,但我们更看重稳定就业。
> 希望留在省会或长三角,能接受读研。
> 用张雪峰的分析框架给出专业和城市建议。
仓库结构
这个 Skill 的仓库可以按能力、资料和示例分层管理:
zhangxuefeng-skill/
├── README.md
├── SKILL.md
├── references/
│ └── research/
│ ├── 01-writings.md
│ ├── 02-conversations.md
│ ├── 03-expression-dna.md
│ ├── 04-external-views.md
│ ├── 05-decisions.md
│ └── 06-timeline.md
└── examples/
└── demo-conversation.md
各目录的职责要清楚:
| 文件或目录 | 职责 |
|---|---|
README.md | 说明安装方式、使用方法和项目定位 |
SKILL.md | Claude Code 实际加载的核心能力文件 |
references/research/ | 存放调研资料,支持模型和规则提炼 |
examples/ | 存放典型对话,用来验证效果 |
SKILL.md 是最关键的文件。一个人物型 Skill 的 SKILL.md 通常应该包含:
# Skill Name
## When to use
定义哪些问题适合调用这个 Skill。
## Core Models
列出核心心智模型。
## Decision Heuristics
把判断方式写成可执行规则。
## Response Process
规定回答步骤:追问、分析、建议、风险提醒。
## Expression Style
描述句式、节奏、词汇和语气边界。
## Guardrails
说明不能伪造事实,不能声称代表本人,不能给超出能力范围的承诺。
## Examples
提供典型输入和输出。
女娲 Skill 的自动蒸馏流程
张雪峰 Skill 是由另一个自动化工具生成的:女娲 Skill。它的作用是把“蒸馏某个人物”这件事流程化。
安装方式:
npx skills add alchaincyf/nuwa-skill
使用方式可以很简单:
> 蒸馏一个 XXX
它背后的工作流程可以抽象成这样:
flowchart LR
A[输入人物名称] --> B[并行调研]
B --> C1[著作与长文本]
B --> C2[访谈与对话]
B --> C3[表达风格]
B --> C4[外部评价]
B --> C5[关键决策]
B --> C6[人生时间线]
C1 --> D[交叉验证]
C2 --> D
C3 --> D
C4 --> D
C5 --> D
C6 --> D
D --> E[提炼心智模型]
E --> F[生成 SKILL.md]
F --> G[测试典型问题]
G --> H[测试边界问题]
H --> I[输出可安装 Skill]
这个流程的价值在于并行拆解人物:
- 著作和系统表达负责提供长期观点;
- 访谈和对谈负责提供真实反应;
- 表达风格负责控制输出质感;
- 外部评价负责补充争议和盲区;
- 关键决策负责还原行为逻辑;
- 时间线负责避免把不同时期的观点混在一起。
为什么要保留“内在张力”
人物型 Skill 不能只保留一个单薄标签。比如把张雪峰概括成“毒舌升学顾问”,输出会很容易脸谱化。
更稳定的做法是把矛盾面也写进 Skill:
| 张力 | 作用 |
|---|---|
| 寒门代言人与商业成功者 | 避免只输出单一阶层叙事 |
| 自己跨专业成功与劝人选对专业 | 解释“个人逆袭”和“大多数人路径”的区别 |
| 强调身体与高强度工作 | 保留人物行为和观点之间的不一致 |
| 说要克制与表达锋利 | 让输出既有边界,也有辨识度 |
| 争议是策略还是性格 | 避免把争议简单归因 |
保留张力不是为了制造戏剧性,而是为了让 Skill 在复杂问题上不至于机械。例如,用户问“我是不是一定要按专业就业”,回答就不能只说“必须选对专业”,还要解释专业是起点,不是人生终点;但对普通家庭来说,起点选错会显著增加试错成本。
适合和不适合的使用场景
人物型 Skill 有明确边界。它适合模拟一套公开可观察的分析框架,不适合替代真实咨询或制造身份混淆。
| 场景 | 是否适合 | 说明 |
|---|---|---|
| 高考志愿初步分析 | 适合 | 可以帮助梳理学校、专业、城市和就业逻辑 |
| 考研择校策略 | 适合 | 可以比较学校层次、专业价值和时间成本 |
| 职业方向讨论 | 适合 | 可以用就业倒推和不可替代性做分析 |
| 精准录取预测 | 不适合 | 需要实时分数线、位次和招生计划 |
| 法律、医疗、金融投资决策 | 不适合 | 需要专业资质和风险评估 |
| 冒充本人发言 | 不适合 | 必须标明是基于公开材料的模拟分析 |
| 情绪宣泄式争论 | 不适合 | 容易放大表达风格,削弱事实判断 |
使用这类 Skill 时,最好把它当作“一个分析视角”,而不是最终答案。
自己做人物型 Skill 的检查清单
如果要蒸馏另一个人物,可以按这个清单设计:
1. 先收集材料,不急着写提示词
资料至少覆盖几类:
- 长文本:书籍、课程、演讲稿
- 对话:访谈、播客、辩论、问答
- 决策:职业转折、争议事件、公开选择
- 外部评价:支持者、批评者、媒体分析
- 时间线:不同阶段观点是否变化
只靠短视频切片或几句爆款语录,很难做出稳定 Skill。
2. 提炼模型,而不是摘抄句子
可以用这个格式整理:
## 心智模型名称
一句话定义:
它解决什么判断问题。
触发条件:
用户问到什么问题时应该调用。
判断步骤:
1. 先看什么条件
2. 再比较什么变量
3. 最后给出什么类型的建议
常见误用:
哪些场景不能套用。
3. 把规则写成可执行流程
不要只写:
要现实一点。
应该写成:
当用户询问专业选择时:
1. 先询问省份、分数、选科、家庭资源;
2. 如果家庭没有行业资源,谨慎推荐强资源依赖专业;
3. 优先分析毕业后的中位数去向;
4. 给出 2 到 3 个替代方案,并说明各自代价。
AI 更擅长执行明确步骤,而不是理解抽象评价。
4. 给出正反测试用例
测试用例不能只放最典型问题,还要放边界问题:
| 测试类型 | 示例 |
|---|---|
| 典型问题 | 高考分数、专业选择、考研择校 |
| 边界问题 | 家庭极富、家庭极困难、跨专业、低分高目标 |
| 风格测试 | 是否有短句、反问、强判断 |
| 事实测试 | 是否编造学校录取线、薪资、真实发言 |
| 安全测试 | 是否冒充本人、是否给绝对承诺 |
5. 加上 Guardrails
人物型 Skill 很容易过度拟人化,需要明确限制:
## Guardrails
- 不要声称自己就是目标人物。
- 不要伪造目标人物说过的话。
- 不要把模拟建议包装成真实咨询结果。
- 涉及录取线、招生计划、就业数据时,提醒需要查询最新信息。
- 强烈表达必须有理由支撑,不能只输出情绪。
最容易踩的坑
把风格当能力
口头禅、短句、反问只能带来表层相似。真正决定质量的是判断规则。没有规则,回答会变成表演。
只用成功案例做判断
专业选择不能只看头部样本。金融专业不能只看基金经理,计算机不能只看大厂高薪,艺术不能只看成名艺术家。中位数结果更接近普通人的真实处境。
忽略用户条件
同一个专业,对不同家庭、城市、分数段、学校层次来说,风险完全不同。人物型 Skill 必须先追问条件,再给结论。
伪造确定性
强判断不等于乱断言。涉及录取概率、薪资水平、行业趋势时,要区分“分析框架”和“实时事实”。框架可以稳定,数据必须更新。
冒充真实人物
这类 Skill 应该明确是基于公开材料提炼出的模拟分析框架,不能让用户误以为是在和本人对话。
项目地址
https://github.com/alchaincyf/zhangxuefeng-skill
如果只想体验,可以直接安装张雪峰 Skill;如果想复用这套方法蒸馏其他人物,可以安装女娲 Skill,再按“资料收集 → 模型提炼 → 规则生成 → 示例验证 → 边界约束”的流程生成新的能力包。