A 股数据 · AI 编程助手 · 零 Key · 七层架构 · 全栈投研 —— simonlin1212/a-stock-data 是一个自包含的 Skill 文件, 把 13 个数据源共 28 个端点封装为一套 AI 编程助手直接 可调用的 A 股数据工具包。安装仅需一条 pip 命令和一次 文件粘贴,无需申请任何 API Key(仅 iwencai 语义搜索 需要独立 Key),上手成本几乎为零。
AI投研差在哪一步
传统 A 股数据获取链条长且零散:行情用通达信/mootdx, 研报查东财,资金流向看同花顺,公告去巨潮。每切一个 数据源就要换一套鉴权方式、改一次脚本。分析师或 量化研究者每周花在数据搬运上的时间不少,却极少有人 把整条链路完整打通——不是技术门槛高,是接口信息分散、 参数细节琐碎,靠自己维护太费精力。 更隐蔽的成本是「每条链路都是脆弱的知识碎片」:今天 百度 PAE 的 ResultCode 可能从 int 变成 string,明天 巨潮公告的 stock 参数从 code,plate 改为 code,orgId。 每次断裂都要 debug 半天,而接口文档往往滞后或缺失。 a-stock-data 瞄准的就是这个痛点:把碎片化的数据源统一进一个 Skill 文件,AI 编程助手读取后可以直接回答问题。你不需要记住 东财 datacenter 的 reportName 参数,也不需要处理百度 PAE 的 ResultCode 类型漂移——这些细节全部在底层封装好了。 具体来说,谁最需要这个工具?日常做个股调研的投研人员、 需要批量对比估值的基金经理助理、写量化策略时手动查 K 线和资金流向的个人投资者,以及想在 AI 对话里直接 拉取 A 股实时数据的技术产品经理。这些人有一个共同点: 需要 A 股数据,但不该花时间在数据爬取的 dirty work 上。
三分钟上手四个场景
安装流程只有三步:创建 skill 目录,下载 SKILL.md, 然后 pip 安装四个依赖——mootdx、requests、pandas、 stockstats。启动 Claude Code 后说一句 「帮我估一下 688017」即可激活。整个流程从零到 首次出数据,不超过两分钟。 兼容性方面,Codex 和 OpenClaw 用户可以直接把 SKILL.md 内容贴入系统 prompt 或项目上下文文件, 不需要安装到特定目录。 下面是四个最有代表性的用法: 场景一:单票估值(30 秒完成) 输入股票代码,a-stock-data 自动拉取实时价、从东财 reportapi 获取 机构一致预期 EPS,再计算前向 PE、PEG 和 PE 消化年数。 流程内置在 SKILL.md 的调研流程中,用户只需求说「帮我估 688017」。 对比传统做法:打开东财研报页面->手动翻找到最新一致预期-> 打开计算器算 PEG——至少好几分钟依赖页面不报错。
场景二:主题研报检索(2 分钟) 通过 iwencai 自然语言搜索「人形机器人产业链 丝杠 减速器」, 返回匹配的研报标题与摘要,再联动东财 PDF 端点到下载链接。 两条路径交叉验证,比单一数据源覆盖率高得多。 这在快速摸底一个产业主题时非常高效——过去你要手动搜多个 平台的关键词,再逐一核对研报时效性。
场景三:资金流向与龙虎榜追踪 个股资金流拆为四档(主力/大单/中单/小单)分钟级净流入, 数据统一走东财 push2。龙虎榜同时支持单股席位查询和 全市场每日汇总。查看某只票是「机构在买还是游资在卖」、 今天全市场净买入最大的票是哪些,一句话解决。 这对于盘中决策和复盘都很有价值。
场景四:新标的一站式调研 内置的新标的调研流程按顺序执行:机构覆盖->估值->概念板块-> 资金流向->龙虎榜->解禁->融资融券。一条命令走完全部七步, 输出结构化的调研卡片。对比传统做法是打开 5-6 个页面、 依次粘贴代码、手动整合结果——省掉的不只是时间,还有 来回切换上下文丢失信息的风险。
零依赖架构设计取舍
a-stock-data 最反直觉的决策是 V3.0 彻底移除了
akshare 依赖。akshare 曾是 Python A 股数据的
事实标准,它封装了上百个接口,但副作用也很明显:
中间层引入版本兼容 bug、pandas 升级导致
ArrowInvalid 崩溃、新增依赖链故障。项目的做法是
直接回到 HTTP API 层面——每个端点的 URL、参数、
鉴权方式全部暴露在 SKILL.md 中,肉眼可读、可调试。
这个决策的核心收益是稳定性。V3.1 发布时替换了 4 个失效接口,
包括百度 PAE 资金流切换到东财 push2、巨潮公告参数格式从
code,plate 更新为 code,orgId。因为代码是扁平的而非嵌套在
第三方封装里,定位失效原因到分钟级,修复成本极低。
另一个值得关注的设计是「Skill 文件 = 数据层」的模式。
传统的 API 封装做的是「你调用我的 Python 函数」,
而 a-stock-data 做的是「AI 编程助手读取 Markdown
描述并直接执行内嵌的 Python 代码」。这相当于把
数据工具的「定义权」从库作者转移到了使用场景——
每个端点都配有激活条件、Python 代码段和返回格式
说明,AI 理解上下文后,再决定用什么端点和参数。
对比传统 Python 包的体验差异很明显:依赖 akshare 时
遇到接口报错,你要判断是底层 API 改了、akshare 版本
没跟上、还是 pandas 不兼容,排错链有三层。在
a-stock-data 里,HTTP 请求和参数转换都在同一个文件里,
从报错到定位到修复通常只需改一个 URL 或一个参数名。
代价也很清楚:代码冗余。SKILL.md 超过 7 万字符,
包含大量重复的模式——多个端点的 HTTP 请求 helper
类似但不完全相同。对于注重 DRY 原则的开发者来说
这反直觉,但项目的权衡是:AI 编程助手不擅长在
多个文件间跳转理解依赖关系,一个自包含文件虽然
冗余,但在「一次上下文注入全部能力」这件事上
效率最高。
数据源优先级也做了明确的层级设计:mootdx TCP 协议
排第一(极低封 IP 风险),腾讯财经 HTTP 排第二,
东财 datacenter/push2 排三四位,需要 API Key 的
iwencai 排第五。这个优先级映射了实际的可用性和
稳定性——大盘行情走 mootdx 几乎没有被封锁的可能性,
而资金流向走东财 push2 虽然直连且免费,但 HTTP
接口偶尔有参数变更风险。
另外值得一提的是,同花顺热点和北向资金走的是
零鉴权直连路径,响应时间实测 73ms。这在盘中查询
「今天哪些股票走强」或「北向资金实时流向」时
非常实用,比经过券商或付费数据终端快得多。
数据翅膀的AI投研
这个项目最直接的落地场景是个人投研工作流的 AI 化。 如果你日常用 Claude Code 或 Codex 做代码开发,现在同一个 AI 助手可以切换到投研模式,直接在对话频道里查行情、看研报、 跟踪资金流向。这比「切出 IDE -> 打开券商软件 -> 手动记录数据 -> 回到 IDE 分析」的链路效率高得多。 更广阔的想象空间在批量和自动化方向。借助 AI 编程助手的 脚本执行能力,可以写一个循环来对比 50 只股票的估值,或者 每日定时跑一遍「今日龙虎榜净买入排名 + 北向资金流向 + 融资融券变化」的复盘流程。这些在过去需要维护一个定时任务 脚本系统,现在只要给 AI 助手一句话指令。 此外,a-stock-data 的「Skill 文件 + 直连 HTTP」模式本身也 提供了一种可复制的架构思路——任何领域的数据分散问题都可以 用类似的「自包含描述文件」来封装,从美股数据到加密货币, 甚至行业数据库。文件的维护者只需要跟踪接口变化并更新代码段, 而不需要维护一个 Python 包的版本发布和依赖管理。 注意使用场景的边界:该项目定位为数据工具,不是交易接口, 不提供下单、风控等券商功能。A 股实时行情的稳定性依赖 mootdx 的 TCP 连接,海外服务器会有超时问题, 需要国内代理。但这些局限不影响它作为 「AI 投研数据层」的价值——2 分钟上手、 28 个端点实测通过,投资回报比很清晰了。 从 V3.0 到 V3.1 的演进也反映了项目的维护节奏: 发布仅 8 天后就识别并修复了 4 个因上游 API 变更导致的失效端点。对于依赖外部公共接口的工具 来说,这种响应速度是可用性的下限要求—— a-stock-data 的扁平架构让它做到了这一点。