Hello 大家好,我是Ginlix AI 的Founder Li Ying,我们团队研究金融Agent 已经1年了;这1年,我们从v1 的简单的deep research[当时还是很领先的:)到现在的langalpha,已经是 v3 版本了,走了很多弯路,也进化了很多,我最开始只是想做一个Agent的工具,帮我从传统的繁琐的股票数据搜集,分析解脱出来,提升效率,但是做着做着,我们觉得我们能做一个在公开市场领先的针对主观交易者的金融Agent ,所以这一年在不断狂奔,这版langalpha,我们自己觉得已经能够满足金融机构级的分析需求以及在global 领先的,并且我们今天将它开源,原因也很多:
第一是我们想build in public,AI Agent的发展日新月异,想吸引更多的人加入我们的项目,我们项目团队现在都是兼职,分布在美国/美东为主,深圳和北京。
第二是对于金融产品来说,大家能够看到运行的架构,透明,可回溯是很重要的事情。
我们选择金融这个垂类而不是做一个通用产品的原因,对于业务场景,特别是金融这样复杂的业务场景,不管是业务know how,还是技术发展,一定是需要垂类产品的。
GitHub: github.com/ginlix-ai/LangAlpha | 商业版: www.ginlix.ai
如果你用过市面上的 AI 金融工具,一定有过这样的体验:你花了10分钟和 Agent 分析完苹果公司的基本面,得到了一份不错的报告。第二天,你想继续深入,问它“把昨天分析的苹果和英伟达对比一下”——它一脸茸然,从零开始。所有昨天的上下文、洞察、框架,全部消失。
这不是某一款产品的问题,这是整个金融 AI Agent 领域的系统性缺陷。
2025年到 2026 年初,AI Agent 在金融领域迎来了一次爆发。从 Dexter 到 OpenClaw,从各种财经分析 Bot 到量化交易助手,市场上涌现出数十个开源和商业项目。然而,当你真正拿这些工具去做专业的金融研究时,会撞上四堵墙。
缺陷一:金鱼记忆(无状态执行)
现有 Agent 大多基于单次对话设计——用户提问,Agent 调用工具,返回结果,对话结束。下次你再问“对比一下 MSFT”,Agent 从零开始,无法继承之前对 AAPL 的任何分析框架和洞察。这种“金鱼记忆”模式直接导致:无法跨公司做系统性对比研究、每次分析都是孤立的、用户需要不断重复提供上下文。
缺陷二:黑盒结论(缺乏可解释性)
用户看到“推荐买入 AAPL”,却无法追溯:基于哪些财务指标?使用了什么估值模型?关键假设是什么?排除了哪些风险?在金融领域,可解释性不是锦上添花,是基本要求。无法解释的决策,无法获得信任,更无法用于合规审查。
缺陷三:短周期限制(无法长期研究)
真实的金融研究是连续的:跨天跟踪财报季、跨周观察市场消化过程、跨月验证投资 thesis 的催化剂。当 Agent 无法保存研究上下文、无法记录中间洞察、无法在后续会话中继续时,它只能处理“点状问题”,无法进行“线性研究”。
缺陷四:工具丰富,能力贫乏
以Dexter 为例,它集或16个金融工具,可以获取财务报表、实时股价、分析师评级。但工具的堆砌不等于研究能力。用户仍然需要手动设计分析框架、自行判断使用哪些工具、人工整合分散信息、自己得出结论。Agent 只是“工具的执行者”,而非“研究的合作者”。
1.2 什么样的金融 Agent 才能实战
想象一下真实的金融研究员是怎么工作的。他的桌上有 Bloomberg 终端、有 Excel 模型、有研究报告草稿、有便签纸——所有这些构成了他的“工作台”。他会做笔记,记录“这家公司毛利率连续 5 个季度提升”;他会建立可复用的分析框架,记录“用 DCF 模型估值科技股时,Terminal Growth Rate 设为 3%”。他的研究不会因为“今天会议结束”就烟消云散。
一个真正能用于实战的金融 Agent,必须能够复刻这种工作方式,具备以下四项核心能力:
LangAlpha 就是为了解决这些问题而诞生的。
在讨论 LangAlpha 的技术实现之前,我们需要理解一个核心概念:Harness Engineering(驾驭工程)。这个概念正在重新定义 AI 工程师的角色——从“写代码的人”,变成“设计 Agent 运行环境的人”。
2026 年 2 月,OpenAI 工程团队发表了一篇影响深远的文章,首次系统阐述了 Harness Engineering 的理念,用一句话定义了它的本质:
"Humans steer. Agents execute."(人类掌舵,代理执行。)
这不只是一句口号。它意味着工程师的核心任务发生了根本性转变:不再是直接编写代码实现功能,而是设计环境、表达意图、构建反馈回路,让 Agent 自主完成工作。
理解这个转变,最好的方式是一个类比:飞行员和飞控系统。飞行员(LLM)依然控制飞机,但飞控软件和安全护栏会干预飞行,防止飞机进入危险状态。Harness 工程师的工作,就是设计这套飞控系统——让“飞行员”能力被充分发挥,同时把错误率降到最低。
用更直白的话说:Agent = 模型 + Harness。如果你不是模型,那你就是 Harness。
一个完整的 Harness 包含以下关键要素:
①知识库结构化(Repository as System of Record)
放弃“一个巨大的 AGENTS.md”模式,改为结构化文档目录。关键原则是:凡是 Agent 在运行时无法访问的信息,对 Agent 来说等同于不存在。所有知识必须编码进可访问的仓库。
②工具与能力封装
为模型提供可调用的工具(API、数据库、代码执行环境等),并在适当时机注入必要的上下文信息。模型发出工具调用请求,Harness 负责执行并反馈结果。
③持久记忆与上下文管理
Harness 为模型维护外部持久记忆(文件、数据库),解决 LLM 的“数字失忆”问题。每次调用模型时,自动将关键历史记忆注入上下文。
④确定性验证与安全隔离
在输出完成前对结果进行检测和测试(lint、类型检查、单元测试),对未通过的自动反馈给 Agent 促使其自我修正。通过沙筱环境隔离执行,避免模型造成意外。
Harness Engineering 的本质是:将“软件工程的规范与纪律”从代码层,转移到脆手架、反馈回路和约束系统层。
在 AI Agent 时代,工程师的核心竞争力不再是“写代码的能力”,而是“设计 Harness 的能力”——创造让 Agent 可以高效、可靠工作的环境。这是一种底层范式的转移,而 LangAlpha 正是这种范式在金融研究领域的系统性实践。
总体而言,Harness 工程将传统软件工程思想映射到 Agent 设计层面:工程师不再直接编写每个分析细节,而是设计一个“生态系统”,让模型自然而然地在其中发挥作用。这种方法强调可复用性、可扩展性和可靠性。在 LangAlpha 中,我们看到这个理念的应用:模型只专注于推理,环境负责数据、记忆和工具。正如 LangChain 所言:“Agent = 模型 + 线束”(Agent = model + harness)[4]。LangAlpha 给 LLM 赋能,打造了一个金融智能体操作系统,使之成为可用的生产级应用。
在金融领域,行情数据具有高频、高量、低延迟的特征,这给系统设计带来挑战:
- 海量流入:各市场的股票、期权、宏观指标等数据实时更新,每秒可能产生成千上万条 tick。系统需要高并发的数据采集和处理能力。
- 存储与访问:原始 tick 级数据体量巨大,不可能全部载入内存。需设计分层存储(冷热数据分离)和高效索引策略,支持历史回放和快速查询。
- 实时/批处理权衡:分析需求分为两类:实时交易分析需要毫秒级响应,而大规模回测可以容忍秒级延迟。如何在同一系统中兼顾这两种模式是难题。
- 增量索引与分区存储:长期存储时按照时间分区(例如按月分表),并对常用查询字段建索引,避免扫描过多无关数据。旧数据可存档为列式压缩格式,如 Parquet,以减少存储和 I/O。
- 负载控制(回压):对于数据突发流量(如开盘尖峰)采用流速控制。在高负荷时暂缓非紧急任务或增加实例扩展,确保核心分析实时性不受影响。
”Temporal-Aware Context Engineering",普通Agent强调的是context的组织,但金融场景下时间维度很重要时间维度对于金融智能体至关重要,最新信息往往最相关。LangAlpha 实现了多种时间感知的上下文策略:
- 时间窗口记忆:仅将最近一段时间(例如过去 30 天)的关键信息注入模型上下文,这样既保留了时效性,也避免了上下文过载。例如,agent.md中记录的发现会自动清理3个月前的数据。
- 事件流存储:所有重大事件(如财报发布、监管公告)都记录为带时间戳的条目,并按顺序保存。模型在生成回答时,会重放相应时间段的事件,以保持分析的因果一致性。
- 时间标签嵌入:在记忆记录和提示语中加入明确的时间信息。例如,在agent.md每条结论前加上“【2026-03-15】”,帮助模型理解该信息是多新的。高级场景下,可使用时间编码(如UNIX时间戳)和衰减函数,对较旧的信息降低权重。
下图示例了一个时间感知的交互流程:用户提出查询,智能体检索最近30天的记忆条目,并获取实时行情,生成回答后将新发现附带时间标签记录下来。这样,模型始终在一个动态更新的时间线中工作:

LangAlpha 将每个研究项目封装为独立工作空间(Workspace),对应一个 Daytona 云沙箱。在此沙箱中,所有数据、脚本、图表和报告都存储于文件系统内,实现分析流程的全程记录和复现。例如,一个研究目录结构可能如下:
work/<task>/ # 当前任务名目录
├── data/ # 原始数据和中间数据集
├── charts/ # 生成的图表和图片
├── scripts/ # Agent执行的代码脚本
├── results/ # 最终报告及输出
└── agent.md # 持久化记忆和研究笔记
这种设计不同于许多只记录日志的工具;LangAlpha 的前端界面(Research Workbench)可以直接浏览文件和内嵌图表[2]。用户可在界面中查看每次工具调用的输出或手动上传文件,所有步骤直观可见。这个实验台式环境保证了:任何对话或决策,都对应实际产生的文件和记录,使得整个研究过程可追溯可回放。
位于工作区根目录的agent.md文件相当于研究的实验记录本[5]。它跨会话、跨线程地持续保存关键信息:包括研究目标、已完成的分析步骤、发现的结论以及各子线程的摘要等内容。LangAlpha 在每次启动对话时会自动注入该记忆的最新内容,确保 Agent 能延续之前的思路而不是从头开始[5]。例如,agent.md中可能记录“【2026-03-12】分析发现:NVIDIA财报即将发布,估值偏高”,这种历史记录会在后续对话中被参考。由于所有内容都存储在工作区,用户可以通过版本控制或界面分享完全复现分析流程。
LangAlpha 平台预置了丰富的金融工具和服务[6]:
- 行情数据:MCP 服务器提供多维度市场数据,包括实时 K 线、企业财报、宏观经济数据和期权链[6][9]。前端还集成了 TradingView 可交互图表。
- 财务分析:内置 23 种金融分析技能(如DCF估值、可比公司分析、财报三表)[11],可自动执行估值、预测和行业比较。
- 检索搜索:支持调用搜索引擎和爬虫抓取最新新闻、研报和论坛信息。
- 通用工具:代码执行、文件读写、生成文档等功能也已集成,便于自定义分析脚本。
Agent 通过自然语言指令或快捷命令调用这些工具,线束负责协调执行并将结果回写到工作区。总体而言,这些工具将复杂的金融分析流程自动化,让 Agent 能够像资深分析师那样系统工作[6]。
LangAlpha 实现了多角色智能体协作框架。复杂任务被拆分为不同角色的子Agent(如数据工程师、分析师、报告专家等),各司其职共同完成目标。更重要的是,LangAlpha 创新性地引入了编程式工具调用 (PTC):当需要处理大量数据时,主 Agent 会生成一段 Python 代码并在 Daytona 沙箱执行[12]。例如,计算股票回归模型时,Agent 自动写出ExecuteCode请求,通过内置 Pandas 库运行分析,只将结果摘要返回。这一方式显著降低了上下文负担,突破了单次对话的令牌限制。简而言之,PTC 让 LangAlpha 在本地运行复杂算法而非让 LLM 直接处理数据[12]。
下面从目标用户、部署模式、扩展性、工具集、记忆机制、可观测性、响应延迟、安全性、数据接口、可复现性、研究支持、许可协议等十余个维度,对比LangAlpha与其他三款系统:
|
维度 |
LangAlpha |
Dexter |
OpenClaw |
Claude Cowork |
|
目标用户 |
专业金融研究员、投资分析师[1][6],适用于券商、资管等机构。 |
金融分析师/量化研究员[13];适合需要自动化财务报告和策略验证的用户。 |
普通开发者和终端用户(通用AI助手)。设计用于自动化个人或团队日常任务。 |
金融行业从业者[14];通过 Claude 平台插件为投行、资产管理、PE 等领域提供专业金融分析工具。 |
|
部署模式 |
前后端分离,服务器/云端部署:后端基于 FastAPI,多租户支持;可容器化,本地部署或云服务皆可[15]。 |
通常本地/单机部署:基于 Bun (JS) 环境,克隆仓库后本地启动,无图形界面。 |
本地持久化后台:在个人电脑或 VPS 上运行的 Node.js 服务[16]。默认绑定本机,亦可配置与聊天工具连接。 |
云端插件:通过 claude.com/plugins 启动,无需自建基础设施[17]。也有社区版开源实现。 |
|
扩展性 |
高度模块化:提供技能扩展框架(可编写自定义 Python 脚本、MCP 技能[11]),支持二次开发。 |
开源可定制,但架构较单一;新增功能需修改代码。没有专门插件生态。 |
通过配置文件和社区技能扩展[18]。支持自定义 Agent (修改 SOUL/TOOLS 文件),可装载第三方插件。 |
插件式扩展:41 个预置金融技能和 11 个数据接口[19]。用户可在 Claude 插件市场添加金融插件,但平台不开放底层扩展。 |
|
工具集 |
深度金融工具:实时行情、财报、估值模型(DCF/三表)、图表、风险评估等[6]。还集成一般计算和可视化工具。 |
基本财经工具:财务指标计算、市场数据查询、网页搜索[20][21]。主要面向财报和量化计算,无专门图表。 |
系统自动化工具:Shell 执行、文件操作、浏览器控制、邮件/聊天管理[22]。工具种类通用,缺少金融专用。 |
专业金融技能:包括 DCF、ESG评估、投资组合分析等在内共41个技能[23];38条快捷指令覆盖常见金融操作。 |
|
记忆/持久化 |
持久工作区:agent.md 跨会话记录研究过程[5];所有文件和对话保存,支持版本控制和回放。 |
默认无持久记忆:每次运行只基于当前上下文。部分数据需用户手动缓存。 |
持久文本文件:Agent 配置和记忆存储在 Markdown 文件中(如MEMORY.md)[18]。方便用本地版本控制管理历史。 |
平台自身无长期记忆功能;每次对话独立。分析数据可保存为外部文件,但系统不维持跨对话记忆。 |
|
可观测性 |
界面友好:提供可交互图表、文件浏览器和子Agent监控面板[2]。后台记录每步操作日志,易审计和追溯。 |
无图形界面,仅命令行输出日志。需要手动查看日志文件,无可视化跟踪功能。 |
纯对话接口:可查看对话历史,但缺少调试/监控界面。Agent内部执行过程不可见,只能检查输出的文件/日志。 |
受限于闭源平台:只能看到与 Agent 的对话记录,无法观察插件内部调用。没有公开日志或可视化工具。 |
|
响应延迟 |
两种模式:深度分析模式使用 PTC 批量处理,初始延迟高;闪电模式快速应答,实时性能好[24]。 |
本地执行快,启动即时;多次 API 调用和大型计算时响应时间取决于网络和计算资源。 |
响应依赖 GPT/Claude 模型运算,本地无额外计算;通常速度与模型延迟相关,多步骤任务响应适中。 |
云端速度稳定:交互响应取决于 Claude 模型推理时间。总体流畅,延迟通常在可接受范围。 |
|
安全性 |
严密隔离:每个工作区运行在独立沙箱内,文件系统受保护[8];敏感凭证加密存储[25],自动隐私审查。支持企业级部署和审计。 |
基本安全性:运行在本地环境,提供循环终止等防护。未内置凭证管理,需要用户自行保障环境安全。 |
默认本地绑定,阻止外网访问[16]。敏感信息通过用户管理,但仍需注意代码安全。 |
由 Anthropic 平台保障:插件经过官方审核,用户无需自行部署。安全性依赖 Claude 的平台机制和登录权限。 |
|
数据接口 |
多源支持:内置高频行情、FMP 基本面、选股器、宏观数据等[6]。用户可按需接入新数据源(MCP 可扩展至任意接口)。 |
集成常用财经 API(如 FinancialDatasets.ai)和网络爬取;无自动切换逻辑,需手动配置新源。 |
无预设金融数据源;可使用内置浏览器插件或外部 API 抓取数据,但须手动实现对接。 |
提供 11 个预设金融数据源[19],包括行业数据和实时行情。用户只能使用已支持源,无法自定义新源(除非开发新插件)。 |
|
可重现性 |
高可重现性:所有输入输出文件可版本控制;支持 Workflow 回放;分析流程完全透明。 |
局部可重现:代码开源可追踪,但结果依赖外部数据和模型输出,难以精确复现。 |
配置与输出均为文本,可用 Git 管理。对话记录可导出,但缺少单元测试和版本管理工具。 |
平台闭源,难以完整复现:用户可以保存对话和输出文件,但无法重现内部模型和插件的准确行为。 |
|
研究支持 |
丰富的金融研究模板:23 种现成技能和自动化任务(DCF、估值、催化剂日历等)[11];并可自定义流程。 |
主要提供一般金融分析功能(规划和数据查询)。缺乏专业化研究模板,用户需自行设计分析流程。 |
通用助理型功能:无金融领域特定功能。可通过定制脚本或社区技能实现相应功能。 |
内置金融聚合技能:41 个预置技能覆盖估值、财务分析、交易筛选等[23];对日常金融任务提供极大便利。 |
|
许可协议 |
Apache-2.0 开源[26] |
MIT 开源[27] |
MIT 开源[28] |
专有授权(免费使用于 Claude 平台,不开放源代码) |
从对比可见,LangAlpha 的独特之处在于结合了专用金融工具与生产级安全机制,使其适用于机构级研究场景[2][6]。Dexter 则以轻量级脚本和实时计算见长,适合快速分析;OpenClaw 着力通用自动化,适合个人日常工作;Claude Cowork 利用大量官方金融插件极大地降低了使用门槛,但其封闭平台限制了用户对底层流程的可控性。用户可根据自身需求选择合适平台:若需要深度可追溯的金融研究,LangAlpha 无疑是更专业的选择。
应用场景:用户需要“筛选三支目前被低估的科技股,并提供清晰的分析过程”。我们通过 LangAlpha 平台演示如何像分析师一样系统完成这项任务:
1. 初始化研究:在工作区创建“科技股选股”任务,明确筛选条件(如市盈率P/E<25、五年增长率>10%)。
2. 基本面筛选:调用内置选股工具筛选符合条件的候选股票列表。
3. 财务打分:对候选股票批量获取财报指标(get_fundamentals),计算增长、盈利能力等分数。
4. 共识检验:使用分析师数据 API(get_analyst_data)查看市场对这些股票的未来预期,结合目标价和评级验证。
5. 图表分析:绘制市盈率、增长率、目标价等图表,辅助可视化判断。
6. 输出建议:综合以上信息,Agent 按得分排序输出前3名股票,并给出文字分析:每只股票的估值水平、增长动因及风险因素。
示例结果:推荐 Apple、Microsoft、Nvidia。输出报告中列出了每项决策依据。例如,Apple 当前 P/E=24,DCF 模型估值高出当前价,分析师目标价偏高说明市场预期上涨;Nvidia 因 AI 热潮而增长显著,预测稳健;Microsoft 财务稳健、技术指标正常。用户可查看附带的数据表和图表理解分析过程。
应用场景:需要“预测 Apple 2026Q2 的 EPS,并分析如果业绩高于预期时股价的表现”。该任务结合时间序列建模与事件影响分析:
1. 历史数据抓取:调用历史数据 API 获取 Apple 过去若干季度的实际 EPS。
2. 预测模型:使用线性回归或时间序列模型预测下一季度 EPS 并计算置信区间。
3. 情景分析:假设不同的实际 EPS 情景(如高于预期10%),调用历史股价数据分析类似事件后股价走势(事件研究)。
4. 结果输出:报告中给出预测值、情景推演的价格波动范围,以及相应投资建议(如若超预期则建议逢低买入)。
示例结果:预测 2026Q2 EPS 为 \$1.25±0.08。若实际 EPS 为 \$1.35(显著超预期),则根据历史数据预测股价可能在盘后上涨 5%;若 EPS 低于预期\$1.15,则股价可能下跌 4%。报告图表展示了历史 EPS 与股价走势的相关性。
在一个名为“均值回归策略”的工作区中,我们演示了四种经典策略的实现:统计套利 (Z-Score)、配对交易、RSI 逆转和布林带逆转。以 RSI 策略为例,其流程如下:
1. 数据准备:调用get_price_history("AAPL", "1d", 365*2)获取两年日线价格。
2. 信号生成:计算14日 RSI,当 RSI从下方突破30时产生买入信号,从上方跌破70时产生卖出信号。
3. 回测与评估:对信号进行历史回测,计算累计收益、胜率和夏普比率。生成包含股价和 RSI 的图表,标注交易点。
4. 策略输出:报告列出了策略绩效(例如胜率60%,最大回撤10%)以及买卖建议。
下表汇总了上述四种策略的信号逻辑、关键参数、优缺点:
|
策略名称 |
信号机制 |
关键参数 |
优点 |
缺点 |
|
统计套利 |
两资产价差的Z值:Z>+2 卖出,Z<-2 买入 |
窗口长度、Z阈值 |
简单易用,适用于强相关资产对;市场中性 |
寻配对要求高;极端行情易爆仓 |
|
配对交易 |
协整检验:价差偏离均值时建立仓位 |
协整检验窗口、残差阈值 |
基于统计理论,风险可控 |
配对筛选耗时;参数敏感,回测复杂 |
|
RSI 逆转 |
RSI<30 买入,RSI>70 卖出 |
RSI周期、阈值 |
无需配对;捕捉短期超买超卖反转 |
大趋势行情中失效;易被持续趋势打穿 |
|
布林带逆转 |
触及20日均线±2σ做反转交易 |
均线窗口、σ倍数 |
捕捉价格偏离均值的回归机会;止损界限清晰 |
在单边行情时回撤大;参数需调优 |
以上案例演示了 LangAlpha 在真实金融分析场景中的应用方式:通过持久工作区和丰富的工具支持,用户可像人类分析师一样进行连续性研究。
LangAlpha 的核心价値,用一句话说:让每个投资者都拥有一个 AI 研究团队。
不是用 Agent 替代人类判断,而是用 Agent 放大人类智慧。不是追求“全自动交易”,而是追求“可解释的深度研究”。
对于个人投资者:零编程基础用自然语言进行专业级研究,保存研究历史持续积累投资认知,生成可分享的分析报告。
对于专业研究员:自动化数据收集和预处理,多任务并行提升研究效率,可追溯、可审计的分析过程。
对于量化团队:快速验证策略想法,系统化保存研究过程,与研究管理系统集成。
LangAlpha 是 Harness Engineering 理念在金融研究领域的首次系统性实践:Workspace 对应“应用可读性”,agent.md 对应“知识库结构化”,多 Agent 协作对应“架构约束”,工具集成对应“环境即杠杆”。