1、RD-Agent实测:AI驱动的因子挖掘框架RD-Agent是微软亚洲研究院开源的“AI驱动研发自动化”框架,核心是让大模型扮演量化研究员、自主完成因子研究闭环。其方法论由“研究mathsfRprimeprime”与“开发mathsfDprimeprime两类智能体构成,量化方向提供fin_factor、fin_model、fin_quant、fin_factor_report四个场景,本篇报告实测对象为fin_factor,仅挖掘因子、模型固定为LightGBM。框架以微软Qlib作为“量化基础设施底座”负责数据、回测与绩效计算,整体须运行于Linux环境,Windows用户需经WSL部署。
2、RD-Agent将每轮因子研究抽象为“假设生成任务分解代码实现执行回测反馈生成”五步循环进行广度优先挖掘。假设生成依靠双层Trace注入,兼顾研究全局视野与即时纠错;代码实现引擎CoSTEER以最多10轮“写代码测试修正”自动调试,并借助成功案例库与失败修复库两个向量知识库做RAG检索,显著提升首次生成成功率;执行回测在隔离Conda环境中逐因子运行,与Alpha158的158个量价特征合并送入LightGBM;反馈环节以极宽松门槛(IC的任何微小提升)推动渐进式进化。基础模型LightGBM凭借GOSS、EFB两项算法创新兼顾训练速度与精度。综合实测,RD-Agent宜定位为“具升级潜力的辅
3、助因子研究工具”,效率可达人工的数十倍,但暂不能替代传统研究流程。核心优势在于因子研究效率显著提升(预估有效因子产出约900个/月)、自动发现人类盲区、累积式学习、完整的实验溯源与多数据源整合能力;劣势在于运行稳定性差、LLM代码质量不稳定、IC优化目标与实盘收益脱钩、对A股特殊机制与前视偏差等细节把握不足。我们建议优先将其用于新数据源因子潜力的快速探索与现有因子库的增量补充,并可通过Prompt注入领域知识、多目标优化、引入另类数据、迭代更强代码模型等方向持续改进。风险提示:量化结论基于历史统计,如若未来市场环境发生变化不排除失效可能;LLM生成代码存在错误的风险,模型也有过拟合风险;LLM
4、挖掘因子具有一定随机性,报告中得到的因子仅代表单次运行结果,不保证可再次按顺序挖到。相关研究5风险提示.211RD-Agent是什么?1.1项目功能与特点传统因子研究高度依赖研究员的经验积累与试错节奏,单人月产因子规模有限,且优秀因子的发现往往与个人知识结构强相关,难以系统化复用。本篇研究中我们以微软亚洲研究院2024年开源的研发自动化框架Research&DevelopmentAgent(RD-Agent)为核心工具,实测大语言模型能否扮演量化研究员的角色,自主完成“提出假设实现因子回测验证迭代改进”的完整闭环。RD-Agent的技术报告于2025年5月发布:R&D-Agent:AnLLM-
5、AgentFrameworkTowardsAutonomousDataScience。其量化金融分支RD-Agent-Quant被NeurIPS2025收录,根据团队公布的实测结果,在公开因子库基准上以约10美元/轮的运行成本实现了相对基线约2倍的年化收益率提升。截至本报告撰写时,项目已迭代至v0.8.0版本,累计提交超过1000次,是目前少数将“AI驱动的R&D自动化”在公开金融场景下系统验证过的开源框架。RD-Agent的核心理念是把因子研究分解为一个可循环的研究链路:LLM读取已有实验记录后提出新假设,由代码自动生成引擎实现因子,再交由Qlib框架完成组合回测与反馈记录,所得结果作为下一
6、轮的输入,理论上可无限迭代。“研究mathsfRprimeprime”与“开发mathsfDprimeprime是RD-Agent方法论中的两个核心模块,分别对应“提出想法”和“落地实现”两类智能体角色。(divcenter)图1:RD-Agent项目流程示意图(/divcenter)RD-Agent并非单一功能的工具,其包含一组不同的研发自动化场景。其中与量化投资直接相关的有四个场景。第一,因子挖掘场景(fin_factor),自动迭代地提出并实现新因子,是本篇研究的核心实测对象;其工作循环只演化因子,模型结构固定为LightGBM。第二,模型研发场景(fin_model),与fin_fac