×

用白毛女神200条帖子升级一个专业研报skill实战

wang wang 发表于2026-07-04 21:19:17 浏览1 评论0

抢沙发发表评论

用白毛女神200条帖子升级一个专业研报skill实战

缘起:200条帖子砸过来

白毛女神Serenity——一个在 X 上专注供应链瓶颈狩猎的投资方法论博主,现在是许多人的KOL(意见领袖哈),每天都有人搬运她的帖子。有人把她的方法论搓成了一个 skill (v1.0),让 AI agent 能自动分析上市公司的供应链瓶颈。

我最初被这个skill所惊艳,只是要真正要参考做决策还是有些迟疑,因为还是偏方法论方面,许多方面还是留白的。

直到有一天,我脑子一热,从 X 上把她最近一个月的帖子——整整200——全部扒了下来。

总结后对着 v1.0 skill 一条一条比对。

比完我沉默了。😶

原来女神这一个月里密集输出了19 skill 根本没覆盖的东西。

v1.0 skill 在她眼里,大概就相当于 “Hello World” 水平。

这篇文章记录的就是这次升级的全过程:

 v1.0  v2.7.2n次迭代,一份 SKILL.md 200膨胀到700+ (先精简然后再度膨胀),增加了若干参考。这是我不断探索skill作为一个复杂智能体的又一个实验。

如果你也是写 skill 的程序员,或者用 AI 做投资的股民——希望这些踩坑经验对你有用,当然还有后面分享的完整新skill,用完请给我反馈哈。

01
一、v1.0:一个“还行”的起点

先说说旧版的情况。不吹不黑,v1.0 做了几件对的事。

✅ 优点一:把方法论简化成了可运行的框架。

Serenity 的原始方法论散落在 X 帖子、Reddit 评论和各种截图里。

v1.0 把它们整理成了一个 9 步工作流:定义稀缺层 → 映射供应链 → 识别瓶颈点 → 分析竞争格局 → 估值对标 → 监控催化剂 → 风险评估 → 情景建模 → 生成标的。

至少 agent 不会一脸茫然地问供应链瓶颈是什么

✅ 优点二:引入了基本的证据分级。

旧版有一个静态的证据分级体系,让 agent 知道公司官方声明我在 Reddit 上看来的更可信。

✅ 优点三:覆盖了基础的供应链分析。

一级供应商、直接客户、单品依赖——这些入门概念都有了。

但问题也很明显。

用后来 200 条帖子做镜子一照,v1.0 的毛病排成一排:

⚠️ 最致命的:瓶颈点和瓶颈混为一谈。

白毛女神的核心框架里,瓶颈点Chokepoint)是必经节点——比如所有 AI 芯片都要用 HBM”,这是参考设计锁死的。

瓶颈Bottleneck)是物理供应受限——比如“HBM 产能不够

她反复强调:理想标的兼具二者。

 v1.0 把两个概念搅在一起,用一种模糊的稀缺层一笔带过。

agent 分析出来的结论基本就是嗯这个环节可能挺稀缺的”——说了等于没说。

谁懂啊。😤

⚠️ OSINT(多跳开源情报) 武器库几乎是空的。

v1.0 要查公开信息,但具体查什么、去哪查,一个字没提。

实际上白毛女神有至少10非传统数据源:LinkedIn 员工动态、美国进出口记录、历史投资者演示 PPT、政府出版物、SEC 申报细节、财报电话会逐字记录、行业会议声明、做空报告、供应商网站变更监控、路透社/Digitimes/Trendforce

v1.0 全漏了。

⚠️ 估值只会说可能存在差距

原文里 Serenity 至少用六种前瞻估值框架来算:预期收入倍数、市净率重置价值、NAV 套利、比较瓶颈估值、TAM 捕获建模、机构持仓信号。

旧版一个都没写。

⚠️ 没有失效标准。

什么时候这个投资论点算死了v1.0 没答案。

白毛女神列了五条:管理层执行失误、客户转向替代供应商、架构转向不同方向、政策变化、收入大幅低于预期。

⚠️ 没有仓位管理。

旧版完全没提怎么建仓、怎么分散、怎么控制回撤。

而白毛女神有一整套跟确认阶梯绑定的仓位规模策略。

换句话说,v1.0 是个看着有模有样,一用心里没底的半成品。

但这不是坏事——没有 v1.0,就没有后来 v2.x 系列的进化土壤。我想要一个专业的研报系统,只能自己动手了。

02
二、触发改变:200条帖子里的隐藏知识点

下载 200 条帖子那天,我开始只想补充一下最新观点

但当我用大模型汇总、分类、对比旧 skill ……

发现了19 v1.0 完全没有覆盖的方法论要素。

它们大概分成四类:

🔍 供应链深度类(缺失最严重):

·瓶颈点 vs 瓶颈的双框架区分

·多跳间接供应链追踪(比如AXTI→IQE→LITE→GOOGL

·供应链级联效应建模(一个节点断了连锁影响最终受益者)

💰 估值与时机类:

·六种前瞻估值框架

·预期验证滞后时间(OSINT 信号行业确认 3-6 机构行动 1-3 重估 3-6 月)

·流通盘动态(散户机构转变、空头持仓催化剂等)

🛡️ 护城河与博弈类:

·五类竞争护城河(参考设计锁定、认证时间线、性能规格、政府支持、产能预分配)

·地缘政治博弈论(出口管制级联、主权供应链建设、军备竞赛动态)

·叙事与现实套利(虚假分析师报告识别、流动性操纵检测)

📐 交易纪律类:

·五级确认阶梯(含每级对应的仓位规模)

·五项论点失效标准

·15实战启发法

最让我破防的是那 15 个启发法。

白毛女神把它们散落在不同帖子里,像是随口一说。

但连起来就是一个完整的逆向思维体系。

比如机构不是你的朋友——她在多个帖子里演示了如何识别机构在出货的同时让分析师唱多(可恶!)。

又比如忽略 TTM,关注前瞻——她反复强调供应链瓶颈股的投资逻辑建立在未来 6-15 个月,看 TTM PE 只会让你错过整个行情。

绝了。

v1.0  agent 要是遇到这些场景,基本只能凭通用 AI 常识瞎猜。

03
三、版本实验日志:v2.0.0 → v2.7.2 的 n 次迭代

升级不是一蹴而就的,而是有空才做的,边琢磨边做的。

 v2.0.0  v2.7.2  n 个版本,走过了四个明显阶段。

阶段一:大补丁时代(v2.0.0🔧

V2.0.0 是第一波大改,一口气把 19 个缺失项全补上了。

这次改动让 SKILL.md 200暴涨到800+

核心变化:

·❌ 废弃稀缺层概念 → ✅ 引入瓶颈点/瓶颈双框架

·❌ 一级供应链 → ✅ 多跳追踪 + 4种溯源技术(投资者演示考古、网站变更监控等)

·❌ 隐式 OSINT → ✅ 10 OSINT 武器库,每个来源都有具体查询模板

·❌ 静态证据分级 → ✅ 五级确认阶梯,每级绑定仓位规模

·❌ 无失效标准 → ✅ 五项论点失效标准

·❌ 9 步通用流程 → ✅ 精确 10 步复现工作流

v2.0.0  agent 第一次能说出这个标的兼具瓶颈点和瓶颈特征这种话。

这才对味了。

阶段二:估值工程化(v2.1.0 ~ v2.6.x📊

v2.0.0 补了框架,但执行起来经常不够具体。

尤其估值部分,agent 虽然知道有六种估值框架,但算出来的东西经常不靠谱——要么忽略汇率,要么用错单位。

翻车了。

这一阶段的迭代集中在:

·v2.1.0:强制要求估值计算必须标注数据来源和日期

·v2.2.0:引入跨市场汇率换算规范(HKG→USDKRW→USD 等)

·v2.3.0 ~ v2.5.0:每个估值框架补充了 3-5 个实际计算案例

·v2.6.0:新增比较瓶颈估值——不只看标的本身,还对比同类瓶颈点上市公司的估值倍率

这一阶段结束后,agent 输出的估值终于稳了——同一天同一标的,多次运行结果一致。

真香。

阶段三:数据流优化(v2.7.0🔗

v2.7.0 要解决一个实际问题:

agent 在多步工作流中经常失忆”—— 3 步算出的供应商依赖关系,到第 7 步估值时就忘了,重新查一遍。

浪费 token 且结果不一致。💸

解决方案:每一步结束时强制写入结构化中间数据,下一步启动时先加载上一步结果。

这个改动不大,但让 10 步工作流的连贯性从经常断变成了基本不翻车

阶段四:去指令化(v2.7.1 ~ v2.7.2🧹

这两个版本是修复而非加功能

v2.7.1 中文强制输出:

v2.0.0~v2.7.0 期间,输出的偶尔是英文版的(虽然中间的交互都是中文的)。

修复方法:在 skill 顶层加入硬性的语言约束规则,并为所有英文术语提供标准中文翻译对照表。

v2.7.2 去指令化:

这是整个迭代里最微妙的一个改动。

中间版本因为增加买方建议大模型给 SKILL.md 里偏激的充满了你必须……”“你必须……”“严禁……”这样的命令式语句。

像一个暴躁的产品经理在咆哮。

实践发现,当指令过于强硬时,大模型有时会产生抗拒”——表现为在输出中夹杂防御性措辞,或者机械照搬模板而丢失分析灵活性。这样的报告给用户也是不合适的。

v2.7.2 把所有命令式改成了描述式。如:你必须使用 10  OSINT 武器库改成在分析供应链瓶颈时可使用以下 10 个非传统信息源

改动很小,效果明显——输出更加自然流畅,agent 也不再过度证明自己在遵守规则

04
四、一张表:v2.7.2 核心能力速览

能力模块

内容

白毛女神原帖来源

🔲 瓶颈双框架

瓶颈点(必经节点)瓶颈(供应受限),理想标的兼具二者

多条帖子反复阐述

🔍 10OSINT武器库

LinkedIn、进出口记录、投资者演示、SEC申报、财报电话会、行业会议、做空报告、供应商网站、政府出版物、路透社/Digitimes

散落在10+条具体案例帖中

🔗 多跳供应链追踪

4种技术:投资者演示考古、网站变更监控、财报电话会交叉验证、进出口数据反查

AXTI→IQE→LITE→GOOGL   案例

📶 五级确认阶梯

OSINT→行业出版物公司声明机构行动政府/监管,每级绑定仓位规模

方法论帖 + 仓位管理帖

💰 六种估值框架

预期收入倍数、市净率重置、NAV套利、比较瓶颈、TAM捕获、机构持仓信号

多个估值案例帖

🛡️ 五类护城河

参考设计锁定、认证时间线、性能规格、政府支持、产能预分配

护城河专题帖

🌊 供应链级联建模

初始冲击受影响节点全球供应%→替代供应商价格提升受益者

地缘政治帖

🌍 地缘政治博弈论

出口管制级联、主权供应链建设、军备竞赛动态、CHIPS法案滞后

政策分析帖

🎭 叙事套利

虚假分析师报告识别、流动性操纵检测、机构报告怀疑论

市场心理帖

🧠 15个启发法

反向克拉默、机构不是朋友、约8个月前瞻、能生产多少>需求够不够、忽略TTM、有毒融资=有毒回报……

散落在日常帖中

❌ 论点失效标准

管理层失误、客户转向替代品、架构变更、政策变化、收入不达预期

风险管理帖

⚖️ 仓位与心理纪律

分级建仓、主题内分散、时间周期匹配、回撤控制

交易纪律帖

05
五、彩蛋:那些差点没发现的改进线索 🥚

整个升级过程中有两条线索特别值得一说。

因为它们差一点就被忽略了。

线索一:v2.6.1 版本的沉默修复。

 v2.6.0 引入比较瓶颈估值后,我发现 agent 在涉及韩国和台湾供应链标的时,偶尔会把韩元和台币的市值直接比较——

忘记换算成统一货币。

这个问题在 v2.6.1 被静默修掉了,版本日志只写了一行修复跨市场比较时汇率不一致的问题

但回头看,这个 bug  v1.0.0 就已经存在了。

只是旧版根本没有比较瓶颈估值这个动作,所以一直没暴露。

不是旧版没 bug,是旧版的功能少到 bug 都懒得出来。 😂

线索二:启发法你听了吗匿名者?的由来。

v2.0.0 新增的 15 个启发法(最初12个)中,有一个叫你听了吗匿名者?Did you listen, Anon?)。

来自白毛女神的一条神秘帖子。

她在帖子里说:当市场出现一种特定的匿名消息模式——“某匿名人士透露 XX 公司可能获得某大客户订单”——并且随后股价大涨时……

大概率是机构已经建仓完毕、开始借助匿名消息吸引散户接盘。

她给这种模式起了个名字叫你听了吗匿名者,作为反向信号使用。

这个启发法在 v1.0.0 里完全不存在,因为旧版根本没有叙事套利这个模块。

YYDS

06
六、优秀 skill 的五个特点(从这次升级的血泪中总结)

1. 最小可行起步,但要知道最小在哪 🎯

v1.0  200 行不是问题。

问题是它不知道自己的 200 行漏了什么。

一个好 skill 的起步版本不需要大而全,但必须清楚地标记待补充区域。 但是对人家开源的skill不能求全责备

2. 实战驱动迭代,不是拍脑袋加功能 🔄

v2.0.0  v2.7.2  n 次迭代中,每一次都是有实际触发原因的。

要么是 agent 输出了错误结论,要么是多次运行结果不一致,要么是这里看不懂

没有一次迭代是因为我觉得这个功能好像挺酷的

这跟写代码一样:不要过早优化,让 bug 来找你。

3.  Agent 精炼是质量天花板的关键 👥

v2.0.0 开始,所有版本都经过一个流程:

相同的要求,新版本产生报告 → Deepseek v4 Pro 按同一要求对专业度、深度、准确度与V1.0产生的报告进行对比 → 人工评判 → 不足项进行新一轮改进

两个 Agent 用不同风格的指令(一个鼓励创造性,一个严格批判),然后交叉对比差异。

这个流程把很多一个 Agent 自己看不出来的问题揪了出来。

 Agent 迭代的天花板远低于双 Agent

4. 数据完整性 > 维度丰富度 📋

有一个教训来自 v2.3.0

当时加了很多分析维度,但 agent 输出开始出现幻觉——维度太多,每个维度都不够深,agent 就开始合理推测

后续迭代收紧为:宁可少分析几个维度,但每个维度都必须有可溯源的数据支撑。

这个原则适用于所有金融类 skill

5. 语调中立是金融 skill 的必选项 😐

v2.7.2 的去指令化不只是让 skill 礼貌

在金融分析场景中,任何带有倾向性的措辞——“这只票太便宜了”“空头一定会被轧空”——都会污染 agent 的分析框架。

白毛女神自己就是语调管理的典范。

她的帖子从不喊单,只呈现逻辑、数据和概率。

v2.7.2 把这个原则固化到了 skill 的系统指令层。

6. 重要一点:数据缓存复用和更新

分析中要的数据太多,重复拉取费时间,按主题分类,将原始和处理过的以md和json保存。

07
尾声

 200 条帖子到 n 次迭代,从 200 行到 700+ 行。

可能挺稀缺的AXTI 在磷化铟衬底市场占比约 80%,且该环节被参考设计锁定,兼具瓶颈点和瓶颈特征

这个 skill 的进化过程,本质上就是一次如何把隐性知识显性化的实战。

白毛女神自己大概不会想到,她的 200 条帖子被一个程序员拆解、分类、交叉验证,最后变成了一份 700 行的 agent 操作手册。

但话说回来,她可能也不会在乎。

毕竟她在帖子里的签名档写的是:

能生产多少 > 需求够不够。别问为什么,去看 AXTI

现在我知道为什么了。

📌 福利时间:粉丝给公众号发消息"serenity"或"白毛女神“,你会获得 v2.7.2 完整skill。需要你更改自己临时目录和可用工具(如东财skill等)。投资有风险,仅供参考。

⭐ 收藏,下次你的 agent 跑偏的时候,这篇文章能给你以灵感。

本文基于 serenity-skill v1.0.→ v2.7.2 真实迭代记录撰写。升级过程中所有方法论要素均来自 Serenity@aleabroreddit)公开发布的帖子。没有终点。