用白毛女神200条帖子升级一个专业研报skill实战

缘起：200条帖子砸过来

“白毛女神”Serenity——一个在 X 上专注供应链瓶颈狩猎的投资方法论博主，现在是许多人的KOL（意见领袖哈），每天都有人搬运她的帖子。有人把她的方法论搓成了一个 skill (v1.0)，让 AI agent 能自动分析上市公司的供应链瓶颈。

我最初被这个skill所惊艳，只是要真正要参考做决策还是有些迟疑，因为还是偏方法论方面，许多方面还是留白的。

直到有一天，我脑子一热，从 X 上把她最近一个月的帖子——整整200条——全部扒了下来。

总结后对着 v1.0 skill 一条一条比对。

比完我沉默了。😶

原来女神这一个月里密集输出了19个旧 skill 根本没覆盖的东西。

v1.0 skill 在她眼里，大概就相当于 “Hello World” 水平。

这篇文章记录的就是这次升级的全过程：

从 v1.0 到 v2.7.2，n次迭代，一份 SKILL.md 从200行膨胀到700+行 (先精简然后再度膨胀），增加了若干参考。这是我不断探索skill作为一个复杂智能体的又一个实验。

如果你也是写 skill 的程序员，或者用 AI 做投资的股民——希望这些踩坑经验对你有用，当然还有后面分享的完整新skill，用完请给我反馈哈。

一、v1.0：一个“还行”的起点

先说说旧版的情况。不吹不黑，v1.0 做了几件对的事。

✅ 优点一：把方法论简化成了可运行的框架。

Serenity 的原始方法论散落在 X 帖子、Reddit 评论和各种截图里。

v1.0 把它们整理成了一个 9 步工作流：定义稀缺层 → 映射供应链 → 识别瓶颈点 → 分析竞争格局 → 估值对标 → 监控催化剂 → 风险评估 → 情景建模 → 生成标的。

至少 agent 不会一脸茫然地问“供应链瓶颈是什么”。

✅ 优点二：引入了基本的证据分级。

旧版有一个静态的证据分级体系，让 agent 知道“公司官方声明”比“我在 Reddit 上看来的”更可信。

✅ 优点三：覆盖了基础的供应链分析。

一级供应商、直接客户、单品依赖——这些入门概念都有了。

但问题也很明显。

用后来 200 条帖子做镜子一照，v1.0 的毛病排成一排：

⚠️ 最致命的：瓶颈点和瓶颈混为一谈。

白毛女神的核心框架里，瓶颈点（Chokepoint）是必经节点——比如“所有 AI 芯片都要用 HBM”，这是参考设计锁死的。

瓶颈（Bottleneck）是物理供应受限——比如“HBM 产能不够”。

她反复强调：理想标的兼具二者。

而 v1.0 把两个概念搅在一起，用一种模糊的“稀缺层”一笔带过。

agent 分析出来的结论基本就是“嗯这个环节可能挺稀缺的”——说了等于没说。

谁懂啊。😤

⚠️ OSINT（多跳开源情报) 武器库几乎是空的。

v1.0 说“要查公开信息”，但具体查什么、去哪查，一个字没提。

实际上白毛女神有至少10类非传统数据源：LinkedIn 员工动态、美国进出口记录、历史投资者演示 PPT、政府出版物、SEC 申报细节、财报电话会逐字记录、行业会议声明、做空报告、供应商网站变更监控、路透社/Digitimes/Trendforce。

v1.0 全漏了。

⚠️ 估值只会说“可能存在差距”。

原文里 Serenity 至少用六种前瞻估值框架来算：预期收入倍数、市净率重置价值、NAV 套利、比较瓶颈估值、TAM 捕获建模、机构持仓信号。

旧版一个都没写。

⚠️ 没有失效标准。

什么时候这个投资论点算“死了”？v1.0 没答案。

白毛女神列了五条：管理层执行失误、客户转向替代供应商、架构转向不同方向、政策变化、收入大幅低于预期。

⚠️ 没有仓位管理。

旧版完全没提怎么建仓、怎么分散、怎么控制回撤。

而白毛女神有一整套跟确认阶梯绑定的仓位规模策略。

换句话说，v1.0 是个“看着有模有样，一用心里没底”的半成品。

但这不是坏事——没有 v1.0，就没有后来 v2.x 系列的进化土壤。我想要一个专业的研报系统，只能自己动手了。

二、触发改变：200条帖子里的隐藏知识点

下载 200 条帖子那天，我开始只想“补充一下最新观点”。

但当我用大模型汇总、分类、对比旧 skill 后……

发现了19个 v1.0 完全没有覆盖的方法论要素。

它们大概分成四类：

🔍 供应链深度类（缺失最严重）：

·瓶颈点 vs 瓶颈的双框架区分

·多跳间接供应链追踪（比如AXTI→IQE→LITE→GOOGL）

·供应链级联效应建模（一个节点断了→连锁影响→最终受益者）

💰 估值与时机类：

·六种前瞻估值框架

·预期验证滞后时间（OSINT 信号→行业确认 3-6 月→机构行动 1-3 月→重估 3-6 月）

·流通盘动态（散户→机构转变、空头持仓催化剂等）

🛡️ 护城河与博弈类：

·五类竞争护城河（参考设计锁定、认证时间线、性能规格、政府支持、产能预分配）

·地缘政治博弈论（出口管制级联、主权供应链建设、军备竞赛动态）

·叙事与现实套利（虚假分析师报告识别、流动性操纵检测）

📐 交易纪律类：

·五级确认阶梯（含每级对应的仓位规模）

·五项论点失效标准

·15个实战启发法

最让我破防的是那 15 个启发法。

白毛女神把它们散落在不同帖子里，像是随口一说。

但连起来就是一个完整的逆向思维体系。

比如“机构不是你的朋友”——她在多个帖子里演示了如何识别机构在出货的同时让分析师唱多（可恶！）。

又比如“忽略 TTM，关注前瞻”——她反复强调供应链瓶颈股的投资逻辑建立在未来 6-15 个月，看 TTM PE 只会让你错过整个行情。

绝了。

v1.0 的 agent 要是遇到这些场景，基本只能凭“通用 AI 常识”瞎猜。

三、版本实验日志：v2.0.0 → v2.7.2 的 n 次迭代

升级不是一蹴而就的，而是有空才做的，边琢磨边做的。

从 v2.0.0 到 v2.7.2 的 n 个版本，走过了四个明显阶段。

阶段一：大补丁时代（v2.0.0）🔧

V2.0.0 是第一波大改，一口气把 19 个缺失项全补上了。

这次改动让 SKILL.md 从200行暴涨到800+行。

核心变化：

·❌ 废弃“稀缺层”概念 → ✅ 引入瓶颈点/瓶颈双框架

·❌ 一级供应链 → ✅ 多跳追踪 + 4种溯源技术（投资者演示考古、网站变更监控等）

·❌ 隐式 OSINT → ✅ 10源 OSINT 武器库，每个来源都有具体查询模板

·❌ 静态证据分级 → ✅ 五级确认阶梯，每级绑定仓位规模

·❌ 无失效标准 → ✅ 五项论点失效标准

·❌ 9 步通用流程 → ✅ 精确 10 步复现工作流

v2.0.0 的 agent 第一次能说出“这个标的兼具瓶颈点和瓶颈特征”这种话。

这才对味了。

阶段二：估值工程化（v2.1.0 ~ v2.6.x）📊

v2.0.0 补了框架，但执行起来经常不够具体。

尤其估值部分，agent 虽然知道“有六种估值框架”，但算出来的东西经常不靠谱——要么忽略汇率，要么用错单位。

翻车了。

这一阶段的迭代集中在：

·v2.1.0：强制要求估值计算必须标注数据来源和日期

·v2.2.0：引入跨市场汇率换算规范（HKG→USD、KRW→USD 等）

·v2.3.0 ~ v2.5.0：每个估值框架补充了 3-5 个实际计算案例

·v2.6.0：新增比较瓶颈估值——不只看标的本身，还对比同类瓶颈点上市公司的估值倍率

这一阶段结束后，agent 输出的估值终于稳了——同一天同一标的，多次运行结果一致。

真香。

阶段三：数据流优化（v2.7.0）🔗

v2.7.0 要解决一个实际问题：

agent 在多步工作流中经常“失忆”——第 3 步算出的供应商依赖关系，到第 7 步估值时就忘了，重新查一遍。

浪费 token 且结果不一致。💸

解决方案：每一步结束时强制写入结构化中间数据，下一步启动时先加载上一步结果。

这个改动不大，但让 10 步工作流的连贯性从“经常断”变成了“基本不翻车”。

阶段四：去指令化（v2.7.1 ~ v2.7.2）🧹

这两个版本是“修复”而非“加功能”。

v2.7.1 中文强制输出：

v2.0.0~v2.7.0 期间，输出的偶尔是英文版的（虽然中间的交互都是中文的）。

修复方法：在 skill 顶层加入硬性的语言约束规则，并为所有英文术语提供标准中文翻译对照表。

v2.7.2 去指令化：

这是整个迭代里最微妙的一个改动。

中间版本因为增加买方建议大模型给 SKILL.md 里偏激的充满了“你必须……”“你必须……”“严禁……”这样的命令式语句。

像一个暴躁的产品经理在咆哮。

实践发现，当指令过于强硬时，大模型有时会产生“抗拒”——表现为在输出中夹杂防御性措辞，或者机械照搬模板而丢失分析灵活性。这样的报告给用户也是不合适的。

v2.7.2 把所有命令式改成了描述式。如：把“你必须使用 10 源 OSINT 武器库”改成“在分析供应链瓶颈时可使用以下 10 个非传统信息源”。

改动很小，效果明显——输出更加自然流畅，agent 也不再“过度证明自己在遵守规则”。

四、一张表：v2.7.2 核心能力速览

能力模块	内容	白毛女神原帖来源
🔲 瓶颈双框架	瓶颈点（必经节点）+ 瓶颈（供应受限），理想标的兼具二者	多条帖子反复阐述
🔍 10源OSINT武器库	LinkedIn、进出口记录、投资者演示、SEC申报、财报电话会、行业会议、做空报告、供应商网站、政府出版物、路透社/Digitimes	散落在10+条具体案例帖中
🔗 多跳供应链追踪	4种技术：投资者演示考古、网站变更监控、财报电话会交叉验证、进出口数据反查	AXTI→IQE→LITE→GOOGL 案例
📶 五级确认阶梯	OSINT→行业出版物→公司声明→机构行动→政府/监管，每级绑定仓位规模	方法论帖 + 仓位管理帖
💰 六种估值框架	预期收入倍数、市净率重置、NAV套利、比较瓶颈、TAM捕获、机构持仓信号	多个估值案例帖
🛡️ 五类护城河	参考设计锁定、认证时间线、性能规格、政府支持、产能预分配	护城河专题帖
🌊 供应链级联建模	初始冲击→受影响节点→全球供应%→替代供应商→价格提升→受益者	地缘政治帖
🌍 地缘政治博弈论	出口管制级联、主权供应链建设、军备竞赛动态、CHIPS法案滞后	政策分析帖
🎭 叙事套利	虚假分析师报告识别、流动性操纵检测、机构报告怀疑论	市场心理帖
🧠 15个启发法	反向克拉默、机构不是朋友、约8个月前瞻、“能生产多少>需求够不够”、忽略TTM、有毒融资=有毒回报……	散落在日常帖中
❌ 论点失效标准	管理层失误、客户转向替代品、架构变更、政策变化、收入不达预期	风险管理帖
⚖️ 仓位与心理纪律	分级建仓、主题内分散、时间周期匹配、回撤控制	交易纪律帖

五、彩蛋：那些差点没发现的改进线索 🥚

整个升级过程中有两条线索特别值得一说。

因为它们差一点就被忽略了。

线索一：v2.6.1 版本的沉默修复。

在 v2.6.0 引入比较瓶颈估值后，我发现 agent 在涉及韩国和台湾供应链标的时，偶尔会把韩元和台币的市值直接比较——

忘记换算成统一货币。

这个问题在 v2.6.1 被静默修掉了，版本日志只写了一行“修复跨市场比较时汇率不一致的问题”。

但回头看，这个 bug 在 v1.0.0 就已经存在了。

只是旧版根本没有“比较瓶颈估值”这个动作，所以一直没暴露。

不是旧版没 bug，是旧版的功能少到 bug 都懒得出来。 😂

线索二：启发法“你听了吗匿名者？”的由来。

v2.0.0 新增的 15 个启发法（最初12个）中，有一个叫“你听了吗匿名者？”（Did you listen, Anon?）。

来自白毛女神的一条神秘帖子。

她在帖子里说：当市场出现一种特定的匿名消息模式——“某匿名人士透露 XX 公司可能获得某大客户订单”——并且随后股价大涨时……

大概率是机构已经建仓完毕、开始借助“匿名消息”吸引散户接盘。

她给这种模式起了个名字叫“你听了吗匿名者”，作为反向信号使用。

这个启发法在 v1.0.0 里完全不存在，因为旧版根本没有叙事套利这个模块。

YYDS。

六、优秀 skill 的五个特点（从这次升级的血泪中总结）

1. 最小可行起步，但要知道“最小”在哪 🎯

v1.0 的 200 行不是问题。

问题是它不知道自己的 200 行漏了什么。

一个好 skill 的起步版本不需要大而全，但必须清楚地标记“待补充”区域。但是对人家开源的skill不能求全责备。

2. 实战驱动迭代，不是拍脑袋加功能 🔄

v2.0.0 到 v2.7.2 的 n 次迭代中，每一次都是有实际触发原因的。

要么是 agent 输出了错误结论，要么是多次运行结果不一致，要么是“这里看不懂”。

没有一次迭代是因为“我觉得这个功能好像挺酷的”。

这跟写代码一样：不要过早优化，让 bug 来找你。

3. 双 Agent 精炼是质量天花板的关键 👥

v2.0.0 开始，所有版本都经过一个流程：

相同的要求，新版本产生报告 → Deepseek v4 Pro 按同一要求对专业度、深度、准确度与V1.0产生的报告进行对比 → 人工评判 → 不足项进行新一轮改进

两个 Agent 用不同风格的指令（一个鼓励创造性，一个严格批判），然后交叉对比差异。

这个流程把很多“一个 Agent 自己看不出来的问题”揪了出来。

单 Agent 迭代的天花板远低于双 Agent。

4. 数据完整性 > 维度丰富度 📋

有一个教训来自 v2.3.0。

当时加了很多分析维度，但 agent 输出开始出现幻觉——维度太多，每个维度都不够深，agent 就开始“合理推测”。

后续迭代收紧为：宁可少分析几个维度，但每个维度都必须有可溯源的数据支撑。

这个原则适用于所有金融类 skill。

5. 语调中立是金融 skill 的必选项 😐

v2.7.2 的去指令化不只是让 skill 更“礼貌”。

在金融分析场景中，任何带有倾向性的措辞——“这只票太便宜了”“空头一定会被轧空”——都会污染 agent 的分析框架。

白毛女神自己就是语调管理的典范。

她的帖子从不喊单，只呈现逻辑、数据和概率。

v2.7.2 把这个原则固化到了 skill 的系统指令层。

6. 重要一点：数据缓存复用和更新

分析中要的数据太多，重复拉取费时间，按主题分类，将原始和处理过的以md和json保存。

尾声

从 200 条帖子到 n 次迭代，从 200 行到 700+ 行。

从“可能挺稀缺的”到“AXTI 在磷化铟衬底市场占比约 80%，且该环节被参考设计锁定，兼具瓶颈点和瓶颈特征”。

这个 skill 的进化过程，本质上就是一次“如何把隐性知识显性化”的实战。

白毛女神自己大概不会想到，她的 200 条帖子被一个程序员拆解、分类、交叉验证，最后变成了一份 700 行的 agent 操作手册。

但话说回来，她可能也不会在乎。

毕竟她在帖子里的签名档写的是：

“能生产多少 > 需求够不够。别问为什么，去看 AXTI。”

现在我知道为什么了。

📌 福利时间：粉丝给公众号发消息"serenity"或"白毛女神“，你会获得 v2.7.2 完整skill。需要你更改自己临时目录和可用工具（如东财skill等）。投资有风险，仅供参考。

⭐ 收藏，下次你的 agent 跑偏的时候，这篇文章能给你以灵感。

本文基于 serenity-skill v1.0.→ v2.7.2 真实迭代记录撰写。升级过程中所有方法论要素均来自 Serenity（@aleabroreddit）公开发布的帖子。没有终点。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

ZBlogIt

Nice to meet you, too!