【东方证券】量化研究参考系列之八:DiffsFormer:用扩散模型扩充股票特征样本-260615(18页).pdf

编号:1268010 PDF 18页 807.41KB 下载积分:VIP专享
下载报告请您先登录!

1、 有关分析师的申明,见本报告最后部分。其他重要信息披露见分析师申明之后部分,或请与您的投资代表联系。并请阅读本证券研究报告最后一页的免责申明。金融工程|专题报告 研究结论研究结论 文献信息:文献信息:本次分享的论文由中国科学技术大学与阿里巴巴达摩院(DAMO Academy)团 队 联 合 撰 写,2024 年 2 月 作 为 arXiv 预 印 本 发 布(编 号 2402.06656),标题为DiffsFormer:A Diffusion Transformer on Stock Factor Augmentation。推荐理由:推荐理由:股票预测长期受困于数据稀缺,论文将其归为信噪比低(

2、特征与收益率相关性绝对值通常不足 0.03)与数据同质化(同行业个股走势趋同)两点,二者使模型易在高维特征空间过拟合、样本外泛化下降。为此论文引入以 Transformer 为骨干的条件扩散模型 DiffsFormer,先在更大源域训练,再对目标域真实样本做“编辑”以扩充训练集。它是上游的即插即用数据增强模块,只增强历史特征、不生成收益率标签(标签沿用真实样本原值),不直接做预测或交易,仅为下游模型扩充训练样本。实证显示,合成数据增强使下游模型在 A 股的样本外年化收益率明显提升。核心框架:核心框架:1)扩散增强原理:对真实特征逐步加噪、再学习逐步去噪,从而拟合特征分布。2)编辑式增强与迁移学

3、习:在更大源域(全 A 股)训练,对目标域(CSI300/CSI800)样本只加噪 T 步再去噪,由 T 控制生成样本偏离目标域的程度。3)条件扩散:以收益率标签与行业为条件、并令生成特征沿用原标签,将扩散模型从生成适配到监督回归,采用 predictor-free guidance 免去额外预测器、简化训练流程。4)即插即用:作为上游模块挂接 MLP、LSTM、Transformer 等八类下游模型,无需改动骨干。亮点分析:亮点分析:相较普通生成式增强,有四点突破:1)以“编辑现有样本”替代“纯噪声生成”,可视化显示增强样本贴近原始分布,保真度更高;2)在更大源域训练再编辑目标域,蒸馏新信息

4、、缓解行业同质化;3)以标签条件化解决标签难匹配问题,效果明显优于直接生成标签;4)即插即用,可适配多类下游预测模型。实证结果:实证结果:实证在 A 股进行,股票池为 CSI300 与 CSI800,特征取自 Qlib 的 Alpha158(回看 8 日),数据期 20082022 年;CSI300 测试八类模型,CSI800 因缺概念数据未纳入 HIST。年化收益率的相对提升上,CSI300 与 CSI800 分别达 7.2%与 27.8%(均为相对提升,并非绝对年化收益率)。机制上,编辑步存在保真度与多样性的权衡(CSI300 上 T=300 最优),标签加行业的联合条件最优;源域选择需结

5、合实证,单纯扩大源域并不必然有效,全 A 股作为源域时迁移效果最好。对照实验显示,编辑式增强优于直接生成、随机加噪与 Shake-shake;仅用增强数据反优于“真实加增强”并集,作者推测与缓解 data collision 有关。改进改进方向:方向:结合 A 股投研流程,四个落地方向:1)适配本土因子池,对接自有因子体系;2)扩展条件维度,在论文已初步尝试市值条件的基础上,系统纳入市值、风格与宏观状态;3)将增强模块嵌入因子挖掘、训练、压力测试与组合风控流程;4)加强实盘约束,重点评估数据泄漏、交易成本与容量,原文未充分扣费,落地需检验净收益。风险提示风险提示 1.生成样本依赖历史分布,对全

6、新市场环境外推有限,建议持续跟踪模型表现。2.编辑步 T 需调参,过大偏离目标域、过小增强有限。3.条件信息设置不当可能导致生成特征与标签不匹配,削弱监督信号质量。4.合成数据训练存在数据泄漏风险,若与真实测试集隐含关联,可能高估样本外表现。5.论文以年化收益率为主、采用 top30drop30 规则且未充分扣费,A 股实盘需检验扣费后净收益。报告发布日期 2026 年 06 月 15 日 刘静涵 执业证书编号:S0860520080003 香港证监会牌照:BSX840 021-63326320 用日频 K 线重建累计 Delta 订单流指标:量化研究参考系列之七 2026-06-09 高频订

友情提示

1、下载报告失败解决办法
2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
4、本站报告下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。

本文(【东方证券】量化研究参考系列之八:DiffsFormer:用扩散模型扩充股票特征样本-260615(18页).pdf)为本站 (向书波) 主动上传,三个皮匠报告文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三个皮匠报告文库(点击联系客服),我们立即给予删除!

温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。
客服
商务合作
小程序
服务号
折叠