芥末
发布于 2026-04-09 / 0 阅读
0
0

用 Claude Code Skill 蒸馏人物认知框架:张雪峰 Skill 的设计思路

一个人物型 Skill 的重点,不是让模型重复几句标志性口头禅,而是把一个人的判断方式拆成可执行的规则。

以张雪峰 Skill 为例,它要解决的问题是:当用户提出专业选择、考研、就业、家庭资源约束这类问题时,Claude Code 能不能按照一套稳定的分析框架给出判断,而不是只在语气上“像”。

换句话说,真正有价值的不是“说话像张雪峰”,而是:

  • 会先问关键条件,而不是直接给结论;
  • 会从就业结果倒推专业选择;
  • 会区分不同家庭资源对应的策略;
  • 会看中位数出路,而不是只拿极端成功案例说事;
  • 会用明确、强判断、高密度表达给出建议。

这类 Skill 更接近一个“认知操作系统”。

Skill 的本质:把人物判断方式封装成可调用能力

在 Claude Code 里,Skill 可以理解为一组可安装、可复用的能力包。它通常由以下几部分组成:

模块作用
SKILL.md核心说明文件,定义使用场景、推理流程、表达风格和约束
references/支撑材料,例如访谈、著作摘录、时间线、决策记录
examples/示例对话,用来验证输出是否稳定
测试用例用典型问题和边界问题检查 Skill 是否跑偏

一个普通提示词可能只有一句:

请用张雪峰的风格回答我的问题。

这种写法的问题很明显:模型容易只学到表层语气,比如短句、反问、强判断,却不知道判断背后的依据。Skill 要做的是把“为什么这么判断”写清楚。

可以把人物型 Skill 拆成四层:

flowchart TB
    A[资料层<br/>书籍、访谈、演讲、公开记录] --> B[模型层<br/>核心心智模型]
    B --> C[规则层<br/>决策启发式和判断流程]
    C --> D[表达层<br/>句式、节奏、词汇、幽默方式]
    D --> E[输出层<br/>面向具体问题生成回答]

资料层提供证据,模型层抽象判断逻辑,规则层负责让 AI 可执行,表达层控制说法,输出层才是用户看到的回答。

张雪峰 Skill 解决的不是“语录复读”

人物型 Skill 最容易做坏的地方,是把它做成语录合集。语录只能解决“像不像”的一小部分问题,不能解决“会不会分析”。

例如,用户问:

河南考生,理科 560 分,想学金融,家庭没有金融行业资源,怎么选?

浅层模仿会给出一些强烈措辞,但分析可能是散的。结构化 Skill 会先进入决策流程:

flowchart TD
    A[用户提出升学/就业问题] --> B{关键信息是否完整}
    B -- 否 --> C[追问省份、分数、专业、家庭资源、城市偏好]
    B -- 是 --> D[判断家庭资源和行业门槛]
    D --> E[查看专业中位数就业去向]
    E --> F[比较学校、城市、专业的优先级]
    F --> G[给出明确建议和风险提醒]

运行结果不是简单说“金融不好”,而是会解释为什么家庭资源、学校层次、岗位供给和就业中位数会共同影响选择。

一个更合格的回答应该类似这样:

先别急着选金融,先把几个条件摆清楚:河南理科 560 分,本科大概率不是顶尖财经院校;家里没有银行、券商、基金相关资源;毕业后还要和更高层次学校的学生竞争同一批岗位。

金融不是不能学,而是它对学校牌子、城市资源、实习机会和家庭人脉都很敏感。普通一本金融毕业生的常见去向,不是投行和基金经理,而是银行网点、销售、运营、后台岗位。

如果目标是毕业后有一门更硬的技能,计算机、电气工程、自动化这类专业更容易形成可迁移能力。金融可以作为辅修、考证或研究生阶段的方向,但本科阶段把全部筹码压上去,风险偏高。

这里的关键不在措辞,而在判断链条:

  1. 先补齐上下文;
  2. 再判断家庭资源;
  3. 再看专业就业中位数;
  4. 再比较可替代性;
  5. 最后给建议。

5 个核心心智模型

张雪峰 Skill 的核心可以压缩成 5 个心智模型。它们负责回答“为什么要这样判断”。

心智模型核心含义在回答里的表现
社会筛子论学历、学校、城市、行业门槛都会参与筛选不只谈兴趣,也谈现实门槛
就业倒推法从毕业后的岗位、薪资、竞争者倒推专业选择看专业时先问“毕业后去哪”
选择大于努力方向错误会放大努力成本强调志愿、城市、专业组合
阶层现实主义家庭资源不同,策略不能一样有资源和没资源的建议会不同
争议即传播表达足够锋利,观点才容易被记住输出明确判断,不绕圈子

这 5 个模型不是孤立使用的。一次专业选择咨询通常会同时触发多个模型。

例如,“家里没钱,想学艺术”这个问题,会同时触发:

  • 阶层现实主义:家庭是否承担得起试错成本;
  • 就业倒推法:艺术专业毕业后的常见就业路径;
  • 选择大于努力:先保证生存能力,再谈长期兴趣;
  • 社会筛子论:行业资源、作品集、训练成本都会筛人。

8 条决策启发式:把抽象模型变成可执行规则

心智模型太抽象,AI 直接使用时容易飘。要让 Skill 稳定输出,需要把模型进一步拆成启发式规则。

启发式具体做法适用问题
灵魂追问法先问分数、省份、专业、家庭背景、城市目标志愿填报、考研择校
中位数原则不看头部神话,也不看最差案例,看中间大多数人专业就业判断
不可替代性检验判断技能是否容易被外包、自动化或低价替代AI 时代职业选择
500 强测试看企业实际招聘地点、专业、学校,而不是听口号行业前景分析
家庭背景分流同一专业对不同家庭意味着不同风险金融、艺术、传媒等专业
城市优先原则城市会影响实习、视野、机会和就业网络本科择校、考研择校
10 年后压迫测试想象工作十年后收入和发展落差是否能接受专业长期价值判断
认态度不认事实道歉法表达可以调整,但核心判断不轻易让步争议观点处理

这些启发式相当于 Skill 的“决策函数”。当用户输入问题时,模型会先判断应该调用哪些规则,再组织回答。

表达 DNA:只学语气不够,但语气也要被结构化

人物型 Skill 不能只有推理规则,还需要表达层。否则回答可能逻辑正确,却完全不像目标人物。

张雪峰式表达大致有几个特征:

维度表现
句式短句多,节奏快,常用反问和强调
词汇高频出现就业、薪资、筛子、敲门砖、天坑、生存
结构先打断误区,再给现实判断,最后用一句高密度总结
幽默夸张、反差、自嘲、东北口语化表达
确定性很少给模糊建议,倾向于明确判断

表达层可以写成类似规则:

## Expression Style

- 使用短句和高密度判断,避免长篇铺垫。
- 回答开始先纠正用户问题里的错误前提。
- 多用现实约束:分数、省份、家庭资源、就业中位数。
- 可以使用反问,但不能只有情绪输出。
- 每个强判断后面必须给出原因。

这里有一个重要原则:表达风格不能压过事实判断。强烈措辞只是外壳,支撑它的必须是专业、就业、城市、家庭资源等可解释因素。

一个合格回答的生成流程

当 Skill 被 Claude Code 调用时,可以按这个顺序生成答案:

sequenceDiagram
    participant U as 用户
    participant C as Claude Code
    participant S as Zhangxuefeng Skill
    participant R as 参考材料与规则

    U->>C: 提出升学/就业问题
    C->>S: 判断是否适合调用 Skill
    S->>R: 读取心智模型、启发式、表达规则
    S->>S: 检查关键信息是否缺失
    alt 信息不足
        S-->>U: 先追问关键条件
    else 信息完整
        S->>S: 调用就业倒推、家庭背景分流等规则
        S-->>U: 输出明确建议、理由和风险
    end

这套流程能避免两个问题:

  1. 信息不足时强行给建议;
  2. 只输出情绪化判断,没有分析过程。

安装和使用

安装 Skill:

npx skills add alchaincyf/zhangxuefeng-skill

在 Claude Code 中可以这样提问:

> 用张雪峰的分析框架评估:河南理科 560 分,想报金融,家庭没有金融行业资源。

也可以让它分析考研和职业方向:

> 本科双非,机械专业,想考研到 985,应该冲名校还是优先换专业?
> AI 发展这么快,计算机、电气、临床医学这些专业还值得选吗?

为了让输出更稳定,提问时最好提供这些信息:

信息为什么重要
省份和分数决定学校层次和可选范围
文理科或选科决定专业限制
家庭资源金融、艺术、传媒等专业尤其依赖资源
城市偏好城市影响实习、就业和认知环境
风险承受能力决定是选稳就业还是高波动方向
长期目标考公、就业、读研、出国对应策略不同

一个信息完整的输入可以这样写:

> 山东物化生,预估 590 分,家庭普通,父母没有行业资源。
> 孩子想学金融,但我们更看重稳定就业。
> 希望留在省会或长三角,能接受读研。
> 用张雪峰的分析框架给出专业和城市建议。

仓库结构

这个 Skill 的仓库可以按能力、资料和示例分层管理:

zhangxuefeng-skill/
├── README.md
├── SKILL.md
├── references/
│   └── research/
│       ├── 01-writings.md
│       ├── 02-conversations.md
│       ├── 03-expression-dna.md
│       ├── 04-external-views.md
│       ├── 05-decisions.md
│       └── 06-timeline.md
└── examples/
    └── demo-conversation.md

各目录的职责要清楚:

文件或目录职责
README.md说明安装方式、使用方法和项目定位
SKILL.mdClaude Code 实际加载的核心能力文件
references/research/存放调研资料,支持模型和规则提炼
examples/存放典型对话,用来验证效果

SKILL.md 是最关键的文件。一个人物型 Skill 的 SKILL.md 通常应该包含:

# Skill Name

## When to use
定义哪些问题适合调用这个 Skill。

## Core Models
列出核心心智模型。

## Decision Heuristics
把判断方式写成可执行规则。

## Response Process
规定回答步骤:追问、分析、建议、风险提醒。

## Expression Style
描述句式、节奏、词汇和语气边界。

## Guardrails
说明不能伪造事实,不能声称代表本人,不能给超出能力范围的承诺。

## Examples
提供典型输入和输出。

女娲 Skill 的自动蒸馏流程

张雪峰 Skill 是由另一个自动化工具生成的:女娲 Skill。它的作用是把“蒸馏某个人物”这件事流程化。

安装方式:

npx skills add alchaincyf/nuwa-skill

使用方式可以很简单:

> 蒸馏一个 XXX

它背后的工作流程可以抽象成这样:

flowchart LR
    A[输入人物名称] --> B[并行调研]
    B --> C1[著作与长文本]
    B --> C2[访谈与对话]
    B --> C3[表达风格]
    B --> C4[外部评价]
    B --> C5[关键决策]
    B --> C6[人生时间线]

    C1 --> D[交叉验证]
    C2 --> D
    C3 --> D
    C4 --> D
    C5 --> D
    C6 --> D

    D --> E[提炼心智模型]
    E --> F[生成 SKILL.md]
    F --> G[测试典型问题]
    G --> H[测试边界问题]
    H --> I[输出可安装 Skill]

这个流程的价值在于并行拆解人物:

  • 著作和系统表达负责提供长期观点;
  • 访谈和对谈负责提供真实反应;
  • 表达风格负责控制输出质感;
  • 外部评价负责补充争议和盲区;
  • 关键决策负责还原行为逻辑;
  • 时间线负责避免把不同时期的观点混在一起。

为什么要保留“内在张力”

人物型 Skill 不能只保留一个单薄标签。比如把张雪峰概括成“毒舌升学顾问”,输出会很容易脸谱化。

更稳定的做法是把矛盾面也写进 Skill:

张力作用
寒门代言人与商业成功者避免只输出单一阶层叙事
自己跨专业成功与劝人选对专业解释“个人逆袭”和“大多数人路径”的区别
强调身体与高强度工作保留人物行为和观点之间的不一致
说要克制与表达锋利让输出既有边界,也有辨识度
争议是策略还是性格避免把争议简单归因

保留张力不是为了制造戏剧性,而是为了让 Skill 在复杂问题上不至于机械。例如,用户问“我是不是一定要按专业就业”,回答就不能只说“必须选对专业”,还要解释专业是起点,不是人生终点;但对普通家庭来说,起点选错会显著增加试错成本。

适合和不适合的使用场景

人物型 Skill 有明确边界。它适合模拟一套公开可观察的分析框架,不适合替代真实咨询或制造身份混淆。

场景是否适合说明
高考志愿初步分析适合可以帮助梳理学校、专业、城市和就业逻辑
考研择校策略适合可以比较学校层次、专业价值和时间成本
职业方向讨论适合可以用就业倒推和不可替代性做分析
精准录取预测不适合需要实时分数线、位次和招生计划
法律、医疗、金融投资决策不适合需要专业资质和风险评估
冒充本人发言不适合必须标明是基于公开材料的模拟分析
情绪宣泄式争论不适合容易放大表达风格,削弱事实判断

使用这类 Skill 时,最好把它当作“一个分析视角”,而不是最终答案。

自己做人物型 Skill 的检查清单

如果要蒸馏另一个人物,可以按这个清单设计:

1. 先收集材料,不急着写提示词

资料至少覆盖几类:

- 长文本:书籍、课程、演讲稿
- 对话:访谈、播客、辩论、问答
- 决策:职业转折、争议事件、公开选择
- 外部评价:支持者、批评者、媒体分析
- 时间线:不同阶段观点是否变化

只靠短视频切片或几句爆款语录,很难做出稳定 Skill。

2. 提炼模型,而不是摘抄句子

可以用这个格式整理:

## 心智模型名称

一句话定义:
它解决什么判断问题。

触发条件:
用户问到什么问题时应该调用。

判断步骤:
1. 先看什么条件
2. 再比较什么变量
3. 最后给出什么类型的建议

常见误用:
哪些场景不能套用。

3. 把规则写成可执行流程

不要只写:

要现实一点。

应该写成:

当用户询问专业选择时:
1. 先询问省份、分数、选科、家庭资源;
2. 如果家庭没有行业资源,谨慎推荐强资源依赖专业;
3. 优先分析毕业后的中位数去向;
4. 给出 2 到 3 个替代方案,并说明各自代价。

AI 更擅长执行明确步骤,而不是理解抽象评价。

4. 给出正反测试用例

测试用例不能只放最典型问题,还要放边界问题:

测试类型示例
典型问题高考分数、专业选择、考研择校
边界问题家庭极富、家庭极困难、跨专业、低分高目标
风格测试是否有短句、反问、强判断
事实测试是否编造学校录取线、薪资、真实发言
安全测试是否冒充本人、是否给绝对承诺

5. 加上 Guardrails

人物型 Skill 很容易过度拟人化,需要明确限制:

## Guardrails

- 不要声称自己就是目标人物。
- 不要伪造目标人物说过的话。
- 不要把模拟建议包装成真实咨询结果。
- 涉及录取线、招生计划、就业数据时,提醒需要查询最新信息。
- 强烈表达必须有理由支撑,不能只输出情绪。

最容易踩的坑

把风格当能力

口头禅、短句、反问只能带来表层相似。真正决定质量的是判断规则。没有规则,回答会变成表演。

只用成功案例做判断

专业选择不能只看头部样本。金融专业不能只看基金经理,计算机不能只看大厂高薪,艺术不能只看成名艺术家。中位数结果更接近普通人的真实处境。

忽略用户条件

同一个专业,对不同家庭、城市、分数段、学校层次来说,风险完全不同。人物型 Skill 必须先追问条件,再给结论。

伪造确定性

强判断不等于乱断言。涉及录取概率、薪资水平、行业趋势时,要区分“分析框架”和“实时事实”。框架可以稳定,数据必须更新。

冒充真实人物

这类 Skill 应该明确是基于公开材料提炼出的模拟分析框架,不能让用户误以为是在和本人对话。

项目地址

https://github.com/alchaincyf/zhangxuefeng-skill

如果只想体验,可以直接安装张雪峰 Skill;如果想复用这套方法蒸馏其他人物,可以安装女娲 Skill,再按“资料收集 → 模型提炼 → 规则生成 → 示例验证 → 边界约束”的流程生成新的能力包。


评论