缘起:200条帖子砸过来
“白毛女神”Serenity——一个在 X 上专注供应链瓶颈狩猎的投资方法论博主,现在是许多人的KOL(意见领袖哈),每天都有人搬运她的帖子。有人把她的方法论搓成了一个 skill (v1.0),让 AI agent 能自动分析上市公司的供应链瓶颈。
我最初被这个skill所惊艳,只是要真正要参考做决策还是有些迟疑,因为还是偏方法论方面,许多方面还是留白的。
直到有一天,我脑子一热,从 X 上把她最近一个月的帖子——整整200条——全部扒了下来。
总结后对着 v1.0 skill 一条一条比对。
比完我沉默了。😶
原来女神这一个月里密集输出了19个旧 skill 根本没覆盖的东西。
v1.0 skill 在她眼里,大概就相当于 “Hello World” 水平。
这篇文章记录的就是这次升级的全过程:
从 v1.0 到 v2.7.2,n次迭代,一份 SKILL.md 从200行膨胀到700+行 (先精简然后再度膨胀),增加了若干参考。这是我不断探索skill作为一个复杂智能体的又一个实验。
如果你也是写 skill 的程序员,或者用 AI 做投资的股民——希望这些踩坑经验对你有用,当然还有后面分享的完整新skill,用完请给我反馈哈。
先说说旧版的情况。不吹不黑,v1.0 做了几件对的事。
✅ 优点一:把方法论简化成了可运行的框架。
Serenity 的原始方法论散落在 X 帖子、Reddit 评论和各种截图里。
v1.0 把它们整理成了一个 9 步工作流:定义稀缺层 → 映射供应链 → 识别瓶颈点 → 分析竞争格局 → 估值对标 → 监控催化剂 → 风险评估 → 情景建模 → 生成标的。
至少 agent 不会一脸茫然地问“供应链瓶颈是什么”。
✅ 优点二:引入了基本的证据分级。
旧版有一个静态的证据分级体系,让 agent 知道“公司官方声明”比“我在 Reddit 上看来的”更可信。
✅ 优点三:覆盖了基础的供应链分析。
一级供应商、直接客户、单品依赖——这些入门概念都有了。
但问题也很明显。
用后来 200 条帖子做镜子一照,v1.0 的毛病排成一排:
⚠️ 最致命的:瓶颈点和瓶颈混为一谈。
白毛女神的核心框架里,瓶颈点(Chokepoint)是必经节点——比如“所有 AI 芯片都要用 HBM”,这是参考设计锁死的。
瓶颈(Bottleneck)是物理供应受限——比如“HBM 产能不够”。
她反复强调:理想标的兼具二者。
而 v1.0 把两个概念搅在一起,用一种模糊的“稀缺层”一笔带过。
agent 分析出来的结论基本就是“嗯这个环节可能挺稀缺的”——说了等于没说。
谁懂啊。😤
⚠️ OSINT(多跳开源情报) 武器库几乎是空的。
v1.0 说“要查公开信息”,但具体查什么、去哪查,一个字没提。
实际上白毛女神有至少10类非传统数据源:LinkedIn 员工动态、美国进出口记录、历史投资者演示 PPT、政府出版物、SEC 申报细节、财报电话会逐字记录、行业会议声明、做空报告、供应商网站变更监控、路透社/Digitimes/Trendforce。
v1.0 全漏了。
⚠️ 估值只会说“可能存在差距”。
原文里 Serenity 至少用六种前瞻估值框架来算:预期收入倍数、市净率重置价值、NAV 套利、比较瓶颈估值、TAM 捕获建模、机构持仓信号。
旧版一个都没写。
⚠️ 没有失效标准。
什么时候这个投资论点算“死了”?v1.0 没答案。
白毛女神列了五条:管理层执行失误、客户转向替代供应商、架构转向不同方向、政策变化、收入大幅低于预期。
⚠️ 没有仓位管理。
旧版完全没提怎么建仓、怎么分散、怎么控制回撤。
而白毛女神有一整套跟确认阶梯绑定的仓位规模策略。
换句话说,v1.0 是个“看着有模有样,一用心里没底”的半成品。
但这不是坏事——没有 v1.0,就没有后来 v2.x 系列的进化土壤。我想要一个专业的研报系统,只能自己动手了。
下载 200 条帖子那天,我开始只想“补充一下最新观点”。
但当我用大模型汇总、分类、对比旧 skill 后……
发现了19个 v1.0 完全没有覆盖的方法论要素。
它们大概分成四类:
🔍 供应链深度类(缺失最严重):
·瓶颈点 vs 瓶颈的双框架区分
·多跳间接供应链追踪(比如AXTI→IQE→LITE→GOOGL)
·供应链级联效应建模(一个节点断了→连锁影响→最终受益者)
💰 估值与时机类:
·六种前瞻估值框架
·预期验证滞后时间(OSINT 信号→行业确认 3-6 月→机构行动 1-3 月→重估 3-6 月)
·流通盘动态(散户→机构转变、空头持仓催化剂等)
🛡️ 护城河与博弈类:
·五类竞争护城河(参考设计锁定、认证时间线、性能规格、政府支持、产能预分配)
·地缘政治博弈论(出口管制级联、主权供应链建设、军备竞赛动态)
·叙事与现实套利(虚假分析师报告识别、流动性操纵检测)
📐 交易纪律类:
·五级确认阶梯(含每级对应的仓位规模)
·五项论点失效标准
·15个实战启发法
最让我破防的是那 15 个启发法。
白毛女神把它们散落在不同帖子里,像是随口一说。
但连起来就是一个完整的逆向思维体系。
比如“机构不是你的朋友”——她在多个帖子里演示了如何识别机构在出货的同时让分析师唱多(可恶!)。
又比如“忽略 TTM,关注前瞻”——她反复强调供应链瓶颈股的投资逻辑建立在未来 6-15 个月,看 TTM PE 只会让你错过整个行情。
绝了。
v1.0 的 agent 要是遇到这些场景,基本只能凭“通用 AI 常识”瞎猜。
升级不是一蹴而就的,而是有空才做的,边琢磨边做的。
从 v2.0.0 到 v2.7.2 的 n 个版本,走过了四个明显阶段。
阶段一:大补丁时代(v2.0.0)🔧
V2.0.0 是第一波大改,一口气把 19 个缺失项全补上了。
这次改动让 SKILL.md 从200行暴涨到800+行。
核心变化:
·❌ 废弃“稀缺层”概念 → ✅ 引入瓶颈点/瓶颈双框架
·❌ 一级供应链 → ✅ 多跳追踪 + 4种溯源技术(投资者演示考古、网站变更监控等)
·❌ 隐式 OSINT → ✅ 10源 OSINT 武器库,每个来源都有具体查询模板
·❌ 静态证据分级 → ✅ 五级确认阶梯,每级绑定仓位规模
·❌ 无失效标准 → ✅ 五项论点失效标准
·❌ 9 步通用流程 → ✅ 精确 10 步复现工作流
v2.0.0 的 agent 第一次能说出“这个标的兼具瓶颈点和瓶颈特征”这种话。
这才对味了。
阶段二:估值工程化(v2.1.0 ~ v2.6.x)📊
v2.0.0 补了框架,但执行起来经常不够具体。
尤其估值部分,agent 虽然知道“有六种估值框架”,但算出来的东西经常不靠谱——要么忽略汇率,要么用错单位。
翻车了。
这一阶段的迭代集中在:
·v2.1.0:强制要求估值计算必须标注数据来源和日期
·v2.2.0:引入跨市场汇率换算规范(HKG→USD、KRW→USD 等)
·v2.3.0 ~ v2.5.0:每个估值框架补充了 3-5 个实际计算案例
·v2.6.0:新增比较瓶颈估值——不只看标的本身,还对比同类瓶颈点上市公司的估值倍率
这一阶段结束后,agent 输出的估值终于稳了——同一天同一标的,多次运行结果一致。
真香。
阶段三:数据流优化(v2.7.0)🔗
v2.7.0 要解决一个实际问题:
agent 在多步工作流中经常“失忆”——第 3 步算出的供应商依赖关系,到第 7 步估值时就忘了,重新查一遍。
浪费 token 且结果不一致。💸
解决方案:每一步结束时强制写入结构化中间数据,下一步启动时先加载上一步结果。
这个改动不大,但让 10 步工作流的连贯性从“经常断”变成了“基本不翻车”。
阶段四:去指令化(v2.7.1 ~ v2.7.2)🧹
这两个版本是“修复”而非“加功能”。
v2.7.1 中文强制输出:
v2.0.0~v2.7.0 期间,输出的偶尔是英文版的(虽然中间的交互都是中文的)。
修复方法:在 skill 顶层加入硬性的语言约束规则,并为所有英文术语提供标准中文翻译对照表。
v2.7.2 去指令化:
这是整个迭代里最微妙的一个改动。
中间版本因为增加买方建议大模型给 SKILL.md 里偏激的充满了“你必须……”“你必须……”“严禁……”这样的命令式语句。
像一个暴躁的产品经理在咆哮。
实践发现,当指令过于强硬时,大模型有时会产生“抗拒”——表现为在输出中夹杂防御性措辞,或者机械照搬模板而丢失分析灵活性。这样的报告给用户也是不合适的。
v2.7.2 把所有命令式改成了描述式。如:把“你必须使用 10 源 OSINT 武器库”改成“在分析供应链瓶颈时可使用以下 10 个非传统信息源”。
改动很小,效果明显——输出更加自然流畅,agent 也不再“过度证明自己在遵守规则”。
能力模块 | 内容 | 白毛女神原帖来源 |
🔲 瓶颈双框架 | 瓶颈点(必经节点)+ 瓶颈(供应受限),理想标的兼具二者 | 多条帖子反复阐述 |
🔍 10源OSINT武器库 | LinkedIn、进出口记录、投资者演示、SEC申报、财报电话会、行业会议、做空报告、供应商网站、政府出版物、路透社/Digitimes | 散落在10+条具体案例帖中 |
🔗 多跳供应链追踪 | 4种技术:投资者演示考古、网站变更监控、财报电话会交叉验证、进出口数据反查 | AXTI→IQE→LITE→GOOGL 案例 |
📶 五级确认阶梯 | OSINT→行业出版物→公司声明→机构行动→政府/监管,每级绑定仓位规模 | 方法论帖 + 仓位管理帖 |
💰 六种估值框架 | 预期收入倍数、市净率重置、NAV套利、比较瓶颈、TAM捕获、机构持仓信号 | 多个估值案例帖 |
🛡️ 五类护城河 | 参考设计锁定、认证时间线、性能规格、政府支持、产能预分配 | 护城河专题帖 |
🌊 供应链级联建模 | 初始冲击→受影响节点→全球供应%→替代供应商→价格提升→受益者 | 地缘政治帖 |
🌍 地缘政治博弈论 | 出口管制级联、主权供应链建设、军备竞赛动态、CHIPS法案滞后 | 政策分析帖 |
🎭 叙事套利 | 虚假分析师报告识别、流动性操纵检测、机构报告怀疑论 | 市场心理帖 |
🧠 15个启发法 | 反向克拉默、机构不是朋友、约8个月前瞻、“能生产多少>需求够不够”、忽略TTM、有毒融资=有毒回报…… | 散落在日常帖中 |
❌ 论点失效标准 | 管理层失误、客户转向替代品、架构变更、政策变化、收入不达预期 | 风险管理帖 |
⚖️ 仓位与心理纪律 | 分级建仓、主题内分散、时间周期匹配、回撤控制 | 交易纪律帖 |
整个升级过程中有两条线索特别值得一说。
因为它们差一点就被忽略了。
线索一:v2.6.1 版本的沉默修复。
在 v2.6.0 引入比较瓶颈估值后,我发现 agent 在涉及韩国和台湾供应链标的时,偶尔会把韩元和台币的市值直接比较——
忘记换算成统一货币。
这个问题在 v2.6.1 被静默修掉了,版本日志只写了一行“修复跨市场比较时汇率不一致的问题”。
但回头看,这个 bug 在 v1.0.0 就已经存在了。
只是旧版根本没有“比较瓶颈估值”这个动作,所以一直没暴露。
不是旧版没 bug,是旧版的功能少到 bug 都懒得出来。 😂
线索二:启发法“你听了吗匿名者?”的由来。
v2.0.0 新增的 15 个启发法(最初12个)中,有一个叫“你听了吗匿名者?”(Did you listen, Anon?)。
来自白毛女神的一条神秘帖子。
她在帖子里说:当市场出现一种特定的匿名消息模式——“某匿名人士透露 XX 公司可能获得某大客户订单”——并且随后股价大涨时……
大概率是机构已经建仓完毕、开始借助“匿名消息”吸引散户接盘。
她给这种模式起了个名字叫“你听了吗匿名者”,作为反向信号使用。
这个启发法在 v1.0.0 里完全不存在,因为旧版根本没有叙事套利这个模块。
YYDS。
1. 最小可行起步,但要知道“最小”在哪 🎯
v1.0 的 200 行不是问题。
问题是它不知道自己的 200 行漏了什么。
一个好 skill 的起步版本不需要大而全,但必须清楚地标记“待补充”区域。 但是对人家开源的skill不能求全责备。
2. 实战驱动迭代,不是拍脑袋加功能 🔄
v2.0.0 到 v2.7.2 的 n 次迭代中,每一次都是有实际触发原因的。
要么是 agent 输出了错误结论,要么是多次运行结果不一致,要么是“这里看不懂”。
没有一次迭代是因为“我觉得这个功能好像挺酷的”。
这跟写代码一样:不要过早优化,让 bug 来找你。
3. 双 Agent 精炼是质量天花板的关键 👥
v2.0.0 开始,所有版本都经过一个流程:
相同的要求,新版本产生报告 → Deepseek v4 Pro 按同一要求对专业度、深度、准确度与V1.0产生的报告进行对比 → 人工评判 → 不足项进行新一轮改进
两个 Agent 用不同风格的指令(一个鼓励创造性,一个严格批判),然后交叉对比差异。
这个流程把很多“一个 Agent 自己看不出来的问题”揪了出来。
单 Agent 迭代的天花板远低于双 Agent。
4. 数据完整性 > 维度丰富度 📋
有一个教训来自 v2.3.0。
当时加了很多分析维度,但 agent 输出开始出现幻觉——维度太多,每个维度都不够深,agent 就开始“合理推测”。
后续迭代收紧为:宁可少分析几个维度,但每个维度都必须有可溯源的数据支撑。
这个原则适用于所有金融类 skill。
5. 语调中立是金融 skill 的必选项 😐
v2.7.2 的去指令化不只是让 skill 更“礼貌”。
在金融分析场景中,任何带有倾向性的措辞——“这只票太便宜了”“空头一定会被轧空”——都会污染 agent 的分析框架。
白毛女神自己就是语调管理的典范。
她的帖子从不喊单,只呈现逻辑、数据和概率。
v2.7.2 把这个原则固化到了 skill 的系统指令层。
6. 重要一点:数据缓存复用和更新
分析中要的数据太多,重复拉取费时间,按主题分类,将原始和处理过的以md和json保存。
从 200 条帖子到 n 次迭代,从 200 行到 700+ 行。
从“可能挺稀缺的”到“AXTI 在磷化铟衬底市场占比约 80%,且该环节被参考设计锁定,兼具瓶颈点和瓶颈特征”。
这个 skill 的进化过程,本质上就是一次“如何把隐性知识显性化”的实战。
白毛女神自己大概不会想到,她的 200 条帖子被一个程序员拆解、分类、交叉验证,最后变成了一份 700 行的 agent 操作手册。
但话说回来,她可能也不会在乎。
毕竟她在帖子里的签名档写的是:
“能生产多少 > 需求够不够。别问为什么,去看 AXTI。”
现在我知道为什么了。
📌 福利时间:粉丝给公众号发消息"serenity"或"白毛女神“,你会获得 v2.7.2 完整skill。需要你更改自己临时目录和可用工具(如东财skill等)。投资有风险,仅供参考。
⭐ 收藏,下次你的 agent 跑偏的时候,这篇文章能给你以灵感。
本文基于 serenity-skill v1.0.→ v2.7.2 真实迭代记录撰写。升级过程中所有方法论要素均来自 Serenity(@aleabroreddit)公开发布的帖子。没有终点。