人工智能

基于Harness架构的最强金融Agent - LangAlpha 宣布开源

LangAlpha 的核心价値，用一句话说：让每个投资者都拥有一个 AI 研究团队。

2026年04月08日

人工智能

Hello 大家好，我是Ginlix AI 的Founder Li Ying，我们团队研究金融Agent 已经1年了；这1年，我们从v1 的简单的deep research[当时还是很领先的：）到现在的langalpha，已经是 v3 版本了，走了很多弯路，也进化了很多，我最开始只是想做一个Agent的工具，帮我从传统的繁琐的股票数据搜集，分析解脱出来，提升效率，但是做着做着，我们觉得我们能做一个在公开市场领先的针对主观交易者的金融Agent ，所以这一年在不断狂奔，这版langalpha，我们自己觉得已经能够满足金融机构级的分析需求以及在global 领先的，并且我们今天将它开源，原因也很多：

第一是我们想build in public，AI Agent的发展日新月异，想吸引更多的人加入我们的项目，我们项目团队现在都是兼职，分布在美国/美东为主，深圳和北京。
第二是对于金融产品来说，大家能够看到运行的架构，透明，可回溯是很重要的事情。

我们选择金融这个垂类而不是做一个通用产品的原因，对于业务场景，特别是金融这样复杂的业务场景，不管是业务know how，还是技术发展，一定是需要垂类产品的。

GitHub: github.com/ginlix-ai/LangAlpha | 商业版: www.ginlix.ai

1、动机：我们为什么要做 LangAlpha？

如果你用过市面上的 AI 金融工具，一定有过这样的体验：你花了10分钟和 Agent 分析完苹果公司的基本面，得到了一份不错的报告。第二天，你想继续深入，问它“把昨天分析的苹果和英伟达对比一下”——它一脸茸然，从零开始。所有昨天的上下文、洞察、框架，全部消失。

这不是某一款产品的问题，这是整个金融 AI Agent 领域的系统性缺陷。

1.1 现有金融 Agent 的根本性缺陷

2025年到 2026 年初，AI Agent 在金融领域迎来了一次爆发。从 Dexter 到 OpenClaw，从各种财经分析 Bot 到量化交易助手，市场上涌现出数十个开源和商业项目。然而，当你真正拿这些工具去做专业的金融研究时，会撞上四堵墙。

缺陷一：金鱼记忆（无状态执行）

现有 Agent 大多基于单次对话设计——用户提问，Agent 调用工具，返回结果，对话结束。下次你再问“对比一下 MSFT”，Agent 从零开始，无法继承之前对 AAPL 的任何分析框架和洞察。这种“金鱼记忆”模式直接导致：无法跨公司做系统性对比研究、每次分析都是孤立的、用户需要不断重复提供上下文。

缺陷二：黑盒结论（缺乏可解释性）

用户看到“推荐买入 AAPL”，却无法追溯：基于哪些财务指标？使用了什么估值模型？关键假设是什么？排除了哪些风险？在金融领域，可解释性不是锦上添花，是基本要求。无法解释的决策，无法获得信任，更无法用于合规审查。

缺陷三：短周期限制（无法长期研究）

真实的金融研究是连续的：跨天跟踪财报季、跨周观察市场消化过程、跨月验证投资 thesis 的催化剂。当 Agent 无法保存研究上下文、无法记录中间洞察、无法在后续会话中继续时，它只能处理“点状问题”，无法进行“线性研究”。

缺陷四：工具丰富，能力贫乏

以Dexter 为例，它集或16个金融工具，可以获取财务报表、实时股价、分析师评级。但工具的堆砌不等于研究能力。用户仍然需要手动设计分析框架、自行判断使用哪些工具、人工整合分散信息、自己得出结论。Agent 只是“工具的执行者”，而非“研究的合作者”。

1.2 什么样的金融 Agent 才能实战

想象一下真实的金融研究员是怎么工作的。他的桌上有 Bloomberg 终端、有 Excel 模型、有研究报告草稿、有便签纸——所有这些构成了他的“工作台”。他会做笔记，记录“这家公司毛利率连续 5 个季度提升”；他会建立可复用的分析框架，记录“用 DCF 模型估值科技股时，Terminal Growth Rate 设为 3%”。他的研究不会因为“今天会议结束”就烟消云散。

一个真正能用于实战的金融 Agent，必须能够复刻这种工作方式，具备以下四项核心能力：

完整的工作空间（Workspace）：保存所有获取的数据、分析过程中编写的脚本和模型、生成的图表和可视化、中间结论和待验证假设。
持久化记忆（Persistent Memory）：跨会话保存关键洞察，建立可复用的分析框架库，记录决策依据和逻辑链，支持后续研究的快速检索。
可解释的分析过程：记录每个工具调用的参数和结果，保存分析脚本（而非仅输出结论），生成结构化的研究报告，支持人工复核和审计。
长周期研究支持：支持多轮次、跨会话的研究，保存历史分析和预测，支持“回到之前的研究继续”，记录预测准确率用于自我改进。

LangAlpha 就是为了解决这些问题而诞生的。

2、 Harness 工程概述

在讨论 LangAlpha 的技术实现之前，我们需要理解一个核心概念：Harness Engineering（驾驭工程）。这个概念正在重新定义 AI 工程师的角色——从“写代码的人”，变成“设计 Agent 运行环境的人”。

2.1 一个颠覆性的定义

2026 年 2 月，OpenAI 工程团队发表了一篇影响深远的文章，首次系统阐述了 Harness Engineering 的理念，用一句话定义了它的本质：

"Humans steer. Agents execute."（人类掌舵，代理执行。）

这不只是一句口号。它意味着工程师的核心任务发生了根本性转变：不再是直接编写代码实现功能，而是设计环境、表达意图、构建反馈回路，让 Agent 自主完成工作。

理解这个转变，最好的方式是一个类比：飞行员和飞控系统。飞行员（LLM）依然控制飞机，但飞控软件和安全护栏会干预飞行，防止飞机进入危险状态。Harness 工程师的工作，就是设计这套飞控系统——让“飞行员”能力被充分发挥，同时把错误率降到最低。

用更直白的话说：Agent = 模型 + Harness。如果你不是模型，那你就是 Harness。

一个完整的 Harness 包含以下关键要素：

①知识库结构化（Repository as System of Record）

放弃“一个巨大的 AGENTS.md”模式，改为结构化文档目录。关键原则是：凡是 Agent 在运行时无法访问的信息，对 Agent 来说等同于不存在。所有知识必须编码进可访问的仓库。

②工具与能力封装

为模型提供可调用的工具（API、数据库、代码执行环境等），并在适当时机注入必要的上下文信息。模型发出工具调用请求，Harness 负责执行并反馈结果。

③持久记忆与上下文管理

Harness 为模型维护外部持久记忆（文件、数据库），解决 LLM 的“数字失忆”问题。每次调用模型时，自动将关键历史记忆注入上下文。

④确定性验证与安全隔离

在输出完成前对结果进行检测和测试（lint、类型检查、单元测试），对未通过的自动反馈给 Agent 促使其自我修正。通过沙筱环境隔离执行，避免模型造成意外。

2.2 Harness Engineering 的本质

Harness Engineering 的本质是：将“软件工程的规范与纪律”从代码层，转移到脆手架、反馈回路和约束系统层。

在 AI Agent 时代，工程师的核心竞争力不再是“写代码的能力”，而是“设计 Harness 的能力”——创造让 Agent 可以高效、可靠工作的环境。这是一种底层范式的转移，而 LangAlpha 正是这种范式在金融研究领域的系统性实践。

2.3 Harness 的价值

总体而言，Harness 工程将传统软件工程思想映射到 Agent 设计层面：工程师不再直接编写每个分析细节，而是设计一个“生态系统”，让模型自然而然地在其中发挥作用。这种方法强调可复用性、可扩展性和可靠性。在 LangAlpha 中，我们看到这个理念的应用：模型只专注于推理，环境负责数据、记忆和工具。正如 LangChain 所言：“Agent = 模型 + 线束”（Agent = model + harness）[4]。LangAlpha 给 LLM 赋能，打造了一个金融智能体操作系统，使之成为可用的生产级应用。

3、LangAlpha 架构实现

3.1 金融时间序列数据难处理

在金融领域，行情数据具有高频、高量、低延迟的特征，这给系统设计带来挑战：
- 海量流入：各市场的股票、期权、宏观指标等数据实时更新，每秒可能产生成千上万条 tick。系统需要高并发的数据采集和处理能力。
- 存储与访问：原始 tick 级数据体量巨大，不可能全部载入内存。需设计分层存储（冷热数据分离）和高效索引策略，支持历史回放和快速查询。
- 实时/批处理权衡：分析需求分为两类：实时交易分析需要毫秒级响应，而大规模回测可以容忍秒级延迟。如何在同一系统中兼顾这两种模式是难题。

- 增量索引与分区存储：长期存储时按照时间分区（例如按月分表），并对常用查询字段建索引，避免扫描过多无关数据。旧数据可存档为列式压缩格式，如 Parquet，以减少存储和 I/O。
- 负载控制（回压）：对于数据突发流量（如开盘尖峰）采用流速控制。在高负荷时暂缓非紧急任务或增加实例扩展，确保核心分析实时性不受影响。

3.2 金融场景下的时间敏感上下文策略

”Temporal-Aware Context Engineering",普通Agent强调的是context的组织,但金融场景下时间维度很重要时间维度对于金融智能体至关重要，最新信息往往最相关。LangAlpha 实现了多种时间感知的上下文策略：
- 时间窗口记忆：仅将最近一段时间（例如过去 30 天）的关键信息注入模型上下文，这样既保留了时效性，也避免了上下文过载。例如，agent.md中记录的发现会自动清理3个月前的数据。
- 事件流存储：所有重大事件（如财报发布、监管公告）都记录为带时间戳的条目，并按顺序保存。模型在生成回答时，会重放相应时间段的事件，以保持分析的因果一致性。
- 时间标签嵌入：在记忆记录和提示语中加入明确的时间信息。例如，在agent.md每条结论前加上“【2026-03-15】”，帮助模型理解该信息是多新的。高级场景下，可使用时间编码（如UNIX时间戳）和衰减函数，对较旧的信息降低权重。

下图示例了一个时间感知的交互流程：用户提出查询，智能体检索最近30天的记忆条目，并获取实时行情，生成回答后将新发现附带时间标签记录下来。这样，模型始终在一个动态更新的时间线中工作：

3.3 实验台（Workspace）机制

LangAlpha 将每个研究项目封装为独立工作空间（Workspace），对应一个 Daytona 云沙箱。在此沙箱中，所有数据、脚本、图表和报告都存储于文件系统内，实现分析流程的全程记录和复现。例如，一个研究目录结构可能如下：

work/<task>/ # 当前任务名目录
├── data/ # 原始数据和中间数据集
├── charts/ # 生成的图表和图片
├── scripts/   # Agent执行的代码脚本
├── results/   # 最终报告及输出
└── agent.md   # 持久化记忆和研究笔记

这种设计不同于许多只记录日志的工具；LangAlpha 的前端界面（Research Workbench）可以直接浏览文件和内嵌图表[2]。用户可在界面中查看每次工具调用的输出或手动上传文件，所有步骤直观可见。这个实验台式环境保证了：任何对话或决策，都对应实际产生的文件和记录，使得整个研究过程可追溯可回放。

3.4 实验记录本（Persistent Memory）

位于工作区根目录的agent.md文件相当于研究的实验记录本[5]。它跨会话、跨线程地持续保存关键信息：包括研究目标、已完成的分析步骤、发现的结论以及各子线程的摘要等内容。LangAlpha 在每次启动对话时会自动注入该记忆的最新内容，确保 Agent 能延续之前的思路而不是从头开始[5]。例如，agent.md中可能记录“【2026-03-12】分析发现：NVIDIA财报即将发布，估值偏高”，这种历史记录会在后续对话中被参考。由于所有内容都存储在工作区，用户可以通过版本控制或界面分享完全复现分析流程。

3.5 工具集成系统

LangAlpha 平台预置了丰富的金融工具和服务[6]：
- 行情数据：MCP 服务器提供多维度市场数据，包括实时 K 线、企业财报、宏观经济数据和期权链[6][9]。前端还集成了 TradingView 可交互图表。
- 财务分析：内置 23 种金融分析技能（如DCF估值、可比公司分析、财报三表）[11]，可自动执行估值、预测和行业比较。
- 检索搜索：支持调用搜索引擎和爬虫抓取最新新闻、研报和论坛信息。
- 通用工具：代码执行、文件读写、生成文档等功能也已集成，便于自定义分析脚本。

Agent 通过自然语言指令或快捷命令调用这些工具，线束负责协调执行并将结果回写到工作区。总体而言，这些工具将复杂的金融分析流程自动化，让 Agent 能够像资深分析师那样系统工作[6]。

3.6 多智能体协作与编程式工具调用（PTC）

LangAlpha 实现了多角色智能体协作框架。复杂任务被拆分为不同角色的子Agent（如数据工程师、分析师、报告专家等），各司其职共同完成目标。更重要的是，LangAlpha 创新性地引入了编程式工具调用 (PTC)：当需要处理大量数据时，主 Agent 会生成一段 Python 代码并在 Daytona 沙箱执行[12]。例如，计算股票回归模型时，Agent 自动写出ExecuteCode请求，通过内置 Pandas 库运行分析，只将结果摘要返回。这一方式显著降低了上下文负担，突破了单次对话的令牌限制。简而言之，PTC 让 LangAlpha 在本地运行复杂算法而非让 LLM 直接处理数据[12]。

4、技术对比：LangAlpha vs Dexter vs OpenClaw vs Claude Cowork

下面从目标用户、部署模式、扩展性、工具集、记忆机制、可观测性、响应延迟、安全性、数据接口、可复现性、研究支持、许可协议等十余个维度，对比LangAlpha与其他三款系统：

维度	LangAlpha	Dexter	OpenClaw	Claude Cowork
目标用户	专业金融研究员、投资分析师[1][6]，适用于券商、资管等机构。	金融分析师/量化研究员[13]；适合需要自动化财务报告和策略验证的用户。	普通开发者和终端用户（通用AI助手）。设计用于自动化个人或团队日常任务。	金融行业从业者[14]；通过 Claude 平台插件为投行、资产管理、PE 等领域提供专业金融分析工具。
部署模式	前后端分离，服务器/云端部署：后端基于 FastAPI，多租户支持；可容器化，本地部署或云服务皆可[15]。	通常本地/单机部署：基于 Bun (JS) 环境，克隆仓库后本地启动，无图形界面。	本地持久化后台：在个人电脑或 VPS 上运行的 Node.js 服务[16]。默认绑定本机，亦可配置与聊天工具连接。	云端插件：通过 claude.com/plugins 启动，无需自建基础设施[17]。也有社区版开源实现。
扩展性	高度模块化：提供技能扩展框架（可编写自定义 Python 脚本、MCP 技能[11]），支持二次开发。	开源可定制，但架构较单一；新增功能需修改代码。没有专门插件生态。	通过配置文件和社区技能扩展[18]。支持自定义 Agent (修改 SOUL/TOOLS 文件)，可装载第三方插件。	插件式扩展：41 个预置金融技能和 11 个数据接口[19]。用户可在 Claude 插件市场添加金融插件，但平台不开放底层扩展。
工具集	深度金融工具：实时行情、财报、估值模型(DCF/三表)、图表、风险评估等[6]。还集成一般计算和可视化工具。	基本财经工具：财务指标计算、市场数据查询、网页搜索[20][21]。主要面向财报和量化计算，无专门图表。	系统自动化工具：Shell 执行、文件操作、浏览器控制、邮件/聊天管理[22]。工具种类通用，缺少金融专用。	专业金融技能：包括 DCF、ESG评估、投资组合分析等在内共41个技能[23]；38条快捷指令覆盖常见金融操作。
记忆/持久化	持久工作区：agent.md 跨会话记录研究过程[5]；所有文件和对话保存，支持版本控制和回放。	默认无持久记忆：每次运行只基于当前上下文。部分数据需用户手动缓存。	持久文本文件：Agent 配置和记忆存储在 Markdown 文件中（如MEMORY.md）[18]。方便用本地版本控制管理历史。	平台自身无长期记忆功能；每次对话独立。分析数据可保存为外部文件，但系统不维持跨对话记忆。
可观测性	界面友好：提供可交互图表、文件浏览器和子Agent监控面板[2]。后台记录每步操作日志，易审计和追溯。	无图形界面，仅命令行输出日志。需要手动查看日志文件，无可视化跟踪功能。	纯对话接口：可查看对话历史，但缺少调试/监控界面。Agent内部执行过程不可见，只能检查输出的文件/日志。	受限于闭源平台：只能看到与 Agent 的对话记录，无法观察插件内部调用。没有公开日志或可视化工具。
响应延迟	两种模式：深度分析模式使用 PTC 批量处理，初始延迟高；闪电模式快速应答，实时性能好[24]。	本地执行快，启动即时；多次 API 调用和大型计算时响应时间取决于网络和计算资源。	响应依赖 GPT/Claude 模型运算，本地无额外计算；通常速度与模型延迟相关，多步骤任务响应适中。	云端速度稳定：交互响应取决于 Claude 模型推理时间。总体流畅，延迟通常在可接受范围。
安全性	严密隔离：每个工作区运行在独立沙箱内，文件系统受保护[8]；敏感凭证加密存储[25]，自动隐私审查。支持企业级部署和审计。	基本安全性：运行在本地环境，提供循环终止等防护。未内置凭证管理，需要用户自行保障环境安全。	默认本地绑定，阻止外网访问[16]。敏感信息通过用户管理，但仍需注意代码安全。	由 Anthropic 平台保障：插件经过官方审核，用户无需自行部署。安全性依赖 Claude 的平台机制和登录权限。
数据接口	多源支持：内置高频行情、FMP 基本面、选股器、宏观数据等[6]。用户可按需接入新数据源（MCP 可扩展至任意接口）。	集成常用财经 API（如 FinancialDatasets.ai）和网络爬取；无自动切换逻辑，需手动配置新源。	无预设金融数据源；可使用内置浏览器插件或外部 API 抓取数据，但须手动实现对接。	提供 11 个预设金融数据源[19]，包括行业数据和实时行情。用户只能使用已支持源，无法自定义新源（除非开发新插件）。
可重现性	高可重现性：所有输入输出文件可版本控制；支持 Workflow 回放；分析流程完全透明。	局部可重现：代码开源可追踪，但结果依赖外部数据和模型输出，难以精确复现。	配置与输出均为文本，可用 Git 管理。对话记录可导出，但缺少单元测试和版本管理工具。	平台闭源，难以完整复现：用户可以保存对话和输出文件，但无法重现内部模型和插件的准确行为。
研究支持	丰富的金融研究模板：23 种现成技能和自动化任务（DCF、估值、催化剂日历等）[11]；并可自定义流程。	主要提供一般金融分析功能（规划和数据查询）。缺乏专业化研究模板，用户需自行设计分析流程。	通用助理型功能：无金融领域特定功能。可通过定制脚本或社区技能实现相应功能。	内置金融聚合技能：41 个预置技能覆盖估值、财务分析、交易筛选等[23]；对日常金融任务提供极大便利。
许可协议	Apache-2.0 开源[26]	MIT 开源[27]	MIT 开源[28]	专有授权（免费使用于 Claude 平台，不开放源代码）

从对比可见，LangAlpha 的独特之处在于结合了专用金融工具与生产级安全机制，使其适用于机构级研究场景[2][6]。Dexter 则以轻量级脚本和实时计算见长，适合快速分析；OpenClaw 着力通用自动化，适合个人日常工作；Claude Cowork 利用大量官方金融插件极大地降低了使用门槛，但其封闭平台限制了用户对底层流程的可控性。用户可根据自身需求选择合适平台：若需要深度可追溯的金融研究，LangAlpha 无疑是更专业的选择。

5、实战案例

5.1 可解释性选股

应用场景：用户需要“筛选三支目前被低估的科技股，并提供清晰的分析过程”。我们通过 LangAlpha 平台演示如何像分析师一样系统完成这项任务：
1. 初始化研究：在工作区创建“科技股选股”任务，明确筛选条件（如市盈率P/E<25、五年增长率>10%）。
2. 基本面筛选：调用内置选股工具筛选符合条件的候选股票列表。
3. 财务打分：对候选股票批量获取财报指标（get_fundamentals），计算增长、盈利能力等分数。
4. 共识检验：使用分析师数据 API（get_analyst_data）查看市场对这些股票的未来预期，结合目标价和评级验证。
5. 图表分析：绘制市盈率、增长率、目标价等图表，辅助可视化判断。
6. 输出建议：综合以上信息，Agent 按得分排序输出前3名股票，并给出文字分析：每只股票的估值水平、增长动因及风险因素。

示例结果：推荐 Apple、Microsoft、Nvidia。输出报告中列出了每项决策依据。例如，Apple 当前 P/E=24，DCF 模型估值高出当前价，分析师目标价偏高说明市场预期上涨；Nvidia 因 AI 热潮而增长显著，预测稳健；Microsoft 财务稳健、技术指标正常。用户可查看附带的数据表和图表理解分析过程。

5.2 财报盈利预测与价格分析

应用场景：需要“预测 Apple 2026Q2 的 EPS，并分析如果业绩高于预期时股价的表现”。该任务结合时间序列建模与事件影响分析：
1. 历史数据抓取：调用历史数据 API 获取 Apple 过去若干季度的实际 EPS。
2. 预测模型：使用线性回归或时间序列模型预测下一季度 EPS 并计算置信区间。
3. 情景分析：假设不同的实际 EPS 情景(如高于预期10%)，调用历史股价数据分析类似事件后股价走势（事件研究）。
4. 结果输出：报告中给出预测值、情景推演的价格波动范围，以及相应投资建议（如若超预期则建议逢低买入）。

示例结果：预测 2026Q2 EPS 为 \$1.25±0.08。若实际 EPS 为 \$1.35（显著超预期），则根据历史数据预测股价可能在盘后上涨 5%；若 EPS 低于预期\$1.15，则股价可能下跌 4%。报告图表展示了历史 EPS 与股价走势的相关性。

5.3 均值回归策略示例

在一个名为“均值回归策略”的工作区中，我们演示了四种经典策略的实现：统计套利 (Z-Score)、配对交易、RSI 逆转和布林带逆转。以 RSI 策略为例，其流程如下：
1. 数据准备：调用get_price_history("AAPL", "1d", 365*2)获取两年日线价格。
2. 信号生成：计算14日 RSI，当 RSI从下方突破30时产生买入信号，从上方跌破70时产生卖出信号。
3. 回测与评估：对信号进行历史回测，计算累计收益、胜率和夏普比率。生成包含股价和 RSI 的图表，标注交易点。
4. 策略输出：报告列出了策略绩效（例如胜率60%，最大回撤10%）以及买卖建议。

5.4 均值回归策略对比表

下表汇总了上述四种策略的信号逻辑、关键参数、优缺点：

策略名称	信号机制	关键参数	优点	缺点
统计套利	两资产价差的Z值：Z>+2 卖出，Z<-2 买入	窗口长度、Z阈值	简单易用，适用于强相关资产对；市场中性	寻配对要求高；极端行情易爆仓
配对交易	协整检验：价差偏离均值时建立仓位	协整检验窗口、残差阈值	基于统计理论，风险可控	配对筛选耗时；参数敏感，回测复杂
RSI 逆转	RSI<30 买入，RSI>70 卖出	RSI周期、阈值	无需配对；捕捉短期超买超卖反转	大趋势行情中失效；易被持续趋势打穿
布林带逆转	触及20日均线±2σ做反转交易	均线窗口、σ倍数	捕捉价格偏离均值的回归机会；止损界限清晰	在单边行情时回撤大；参数需调优

以上案例演示了 LangAlpha 在真实金融分析场景中的应用方式：通过持久工作区和丰富的工具支持，用户可像人类分析师一样进行连续性研究。

6、总结：不是另一个工具集，而是一个实验室

LangAlpha 的核心价値，用一句话说：让每个投资者都拥有一个 AI 研究团队。

不是用 Agent 替代人类判断，而是用 Agent 放大人类智慧。不是追求“全自动交易”，而是追求“可解释的深度研究”。

对于个人投资者：零编程基础用自然语言进行专业级研究，保存研究历史持续积累投资认知，生成可分享的分析报告。

对于专业研究员：自动化数据收集和预处理，多任务并行提升研究效率，可追溯、可审计的分析过程。

对于量化团队：快速验证策略想法，系统化保存研究过程，与研究管理系统集成。

LangAlpha 是 Harness Engineering 理念在金融研究领域的首次系统性实践：Workspace 对应“应用可读性”，agent.md 对应“知识库结构化”，多 Agent 协作对应“架构约束”，工具集成对应“环境即杠杆”。