说句话就出 A 股研报:a-stock-data 给 AI 助手装了 28 个数据接口

A 股数据 · AI 编程助手 · 零 Key · 七层架构 · 全栈投研 —— simonlin1212/a-stock-data 是一个自包含的 Skill 文件，把 13 个数据源共 28 个端点封装为一套 AI 编程助手直接可调用的 A 股数据工具包。安装仅需一条 pip 命令和一次文件粘贴，无需申请任何 API Key（仅 iwencai 语义搜索需要独立 Key），上手成本几乎为零。

AI投研差在哪一步

传统 A 股数据获取链条长且零散：行情用通达信/mootdx，研报查东财，资金流向看同花顺，公告去巨潮。每切一个数据源就要换一套鉴权方式、改一次脚本。分析师或量化研究者每周花在数据搬运上的时间不少，却极少有人把整条链路完整打通——不是技术门槛高，是接口信息分散、参数细节琐碎，靠自己维护太费精力。更隐蔽的成本是「每条链路都是脆弱的知识碎片」：今天百度 PAE 的 ResultCode 可能从 int 变成 string，明天巨潮公告的 stock 参数从 code,plate 改为 code,orgId。每次断裂都要 debug 半天，而接口文档往往滞后或缺失。 a-stock-data 瞄准的就是这个痛点：把碎片化的数据源统一进一个 Skill 文件，AI 编程助手读取后可以直接回答问题。你不需要记住东财 datacenter 的 reportName 参数，也不需要处理百度 PAE 的 ResultCode 类型漂移——这些细节全部在底层封装好了。具体来说，谁最需要这个工具？日常做个股调研的投研人员、需要批量对比估值的基金经理助理、写量化策略时手动查 K 线和资金流向的个人投资者，以及想在 AI 对话里直接拉取 A 股实时数据的技术产品经理。这些人有一个共同点：需要 A 股数据，但不该花时间在数据爬取的 dirty work 上。

三分钟上手四个场景

安装流程只有三步：创建 skill 目录，下载 SKILL.md，然后 pip 安装四个依赖——mootdx、requests、pandas、 stockstats。启动 Claude Code 后说一句「帮我估一下 688017」即可激活。整个流程从零到首次出数据，不超过两分钟。兼容性方面，Codex 和 OpenClaw 用户可以直接把 SKILL.md 内容贴入系统 prompt 或项目上下文文件，不需要安装到特定目录。下面是四个最有代表性的用法： 场景一：单票估值（30 秒完成） 输入股票代码，a-stock-data 自动拉取实时价、从东财 reportapi 获取机构一致预期 EPS，再计算前向 PE、PEG 和 PE 消化年数。流程内置在 SKILL.md 的调研流程中，用户只需求说「帮我估 688017」。对比传统做法：打开东财研报页面->手动翻找到最新一致预期-> 打开计算器算 PEG——至少好几分钟依赖页面不报错。

场景二：主题研报检索（2 分钟） 通过 iwencai 自然语言搜索「人形机器人产业链丝杠减速器」，返回匹配的研报标题与摘要，再联动东财 PDF 端点到下载链接。两条路径交叉验证，比单一数据源覆盖率高得多。这在快速摸底一个产业主题时非常高效——过去你要手动搜多个平台的关键词，再逐一核对研报时效性。

场景三：资金流向与龙虎榜追踪 个股资金流拆为四档（主力/大单/中单/小单）分钟级净流入，数据统一走东财 push2。龙虎榜同时支持单股席位查询和全市场每日汇总。查看某只票是「机构在买还是游资在卖」、今天全市场净买入最大的票是哪些，一句话解决。这对于盘中决策和复盘都很有价值。

场景四：新标的一站式调研 内置的新标的调研流程按顺序执行：机构覆盖->估值->概念板块-> 资金流向->龙虎榜->解禁->融资融券。一条命令走完全部七步，输出结构化的调研卡片。对比传统做法是打开 5-6 个页面、依次粘贴代码、手动整合结果——省掉的不只是时间，还有来回切换上下文丢失信息的风险。

零依赖架构设计取舍

a-stock-data 最反直觉的决策是 V3.0 彻底移除了 akshare 依赖。akshare 曾是 Python A 股数据的事实标准，它封装了上百个接口，但副作用也很明显：中间层引入版本兼容 bug、pandas 升级导致 ArrowInvalid 崩溃、新增依赖链故障。项目的做法是直接回到 HTTP API 层面——每个端点的 URL、参数、鉴权方式全部暴露在 SKILL.md 中，肉眼可读、可调试。这个决策的核心收益是稳定性。V3.1 发布时替换了 4 个失效接口，包括百度 PAE 资金流切换到东财 push2、巨潮公告参数格式从 code,plate 更新为 code,orgId。因为代码是扁平的而非嵌套在第三方封装里，定位失效原因到分钟级，修复成本极低。另一个值得关注的设计是「Skill 文件 = 数据层」的模式。传统的 API 封装做的是「你调用我的 Python 函数」，而 a-stock-data 做的是「AI 编程助手读取 Markdown 描述并直接执行内嵌的 Python 代码」。这相当于把数据工具的「定义权」从库作者转移到了使用场景—— 每个端点都配有激活条件、Python 代码段和返回格式说明，AI 理解上下文后，再决定用什么端点和参数。对比传统 Python 包的体验差异很明显：依赖 akshare 时遇到接口报错，你要判断是底层 API 改了、akshare 版本没跟上、还是 pandas 不兼容，排错链有三层。在 a-stock-data 里，HTTP 请求和参数转换都在同一个文件里，从报错到定位到修复通常只需改一个 URL 或一个参数名。代价也很清楚：代码冗余。SKILL.md 超过 7 万字符，包含大量重复的模式——多个端点的 HTTP 请求 helper 类似但不完全相同。对于注重 DRY 原则的开发者来说这反直觉，但项目的权衡是：AI 编程助手不擅长在多个文件间跳转理解依赖关系，一个自包含文件虽然冗余，但在「一次上下文注入全部能力」这件事上效率最高。数据源优先级也做了明确的层级设计：mootdx TCP 协议排第一（极低封 IP 风险），腾讯财经 HTTP 排第二，东财 datacenter/push2 排三四位，需要 API Key 的 iwencai 排第五。这个优先级映射了实际的可用性和稳定性——大盘行情走 mootdx 几乎没有被封锁的可能性，而资金流向走东财 push2 虽然直连且免费，但 HTTP 接口偶尔有参数变更风险。另外值得一提的是，同花顺热点和北向资金走的是零鉴权直连路径，响应时间实测 73ms。这在盘中查询「今天哪些股票走强」或「北向资金实时流向」时非常实用，比经过券商或付费数据终端快得多。

数据翅膀的AI投研

这个项目最直接的落地场景是个人投研工作流的 AI 化。如果你日常用 Claude Code 或 Codex 做代码开发，现在同一个 AI 助手可以切换到投研模式，直接在对话频道里查行情、看研报、跟踪资金流向。这比「切出 IDE -> 打开券商软件 -> 手动记录数据 -> 回到 IDE 分析」的链路效率高得多。更广阔的想象空间在批量和自动化方向。借助 AI 编程助手的脚本执行能力，可以写一个循环来对比 50 只股票的估值，或者每日定时跑一遍「今日龙虎榜净买入排名 + 北向资金流向 + 融资融券变化」的复盘流程。这些在过去需要维护一个定时任务脚本系统，现在只要给 AI 助手一句话指令。此外，a-stock-data 的「Skill 文件 + 直连 HTTP」模式本身也提供了一种可复制的架构思路——任何领域的数据分散问题都可以用类似的「自包含描述文件」来封装，从美股数据到加密货币，甚至行业数据库。文件的维护者只需要跟踪接口变化并更新代码段，而不需要维护一个 Python 包的版本发布和依赖管理。注意使用场景的边界：该项目定位为数据工具，不是交易接口，不提供下单、风控等券商功能。A 股实时行情的稳定性依赖 mootdx 的 TCP 连接，海外服务器会有超时问题，需要国内代理。但这些局限不影响它作为「AI 投研数据层」的价值——2 分钟上手、 28 个端点实测通过，投资回报比很清晰了。从 V3.0 到 V3.1 的演进也反映了项目的维护节奏：发布仅 8 天后就识别并修复了 4 个因上游 API 变更导致的失效端点。对于依赖外部公共接口的工具来说，这种响应速度是可用性的下限要求—— a-stock-data 的扁平架构让它做到了这一点。

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

ZBlogIt

Nice to meet you, too!

说句话就出 A 股研报:a-stock-data 给 AI 助手装了 28 个数据接口

wang 发表于2026-05-26 18:10:52 浏览1 评论0

少长咸集