橘子百科-橘子都知道橘子百科-橘子都知道

【东方金工·说深度】第15期:DFQ-HIST:添加图信息的选股因子挖掘系统

【东方金工·说深度】第15期:DFQ-HIST:添加图信息的选股因子挖掘系统

(来源:东方金工研(yán)究)

  • HIST模型(sHare Information for Stock Trend forecasting,基于图(tú)的可通过挖掘概念共享信息进行股(gǔ)票趋势预测),由中山大 学和微软亚洲研究(jiū)院合作(zuò)在2022  1 月发布于arXiv

  • DFQ-HIST模型在 原文模型基础上进行修改和优化,是 一种新的股票趋势预测框架,能够充分挖 掘股票预定义(yì)概(gài)念和隐藏概念中的动态共享(xiǎng)信息:1)刻画股票联动现(xiàn)象;(2)引入人(rén)工预定义概念,并且考虑到了预定义概念的不完备性(xìng)和(hé)动态变化性;(3)引入隐(yǐn)藏概念,进一步挖掘股票关联信(xìn)息;(4)应用注意力机制,将个股信息和概念信息进 行融(róng)合;(5)加入股票时序(xù)特征编(biān)码模块,融合股票自身的历史时序特征信息;(6)使用双重(zhòng)残差学习结构,处理不同模块的信息。(7)相比其他(tā)常(cháng)见图模型,HIST模型效果最(zuì)好。

  • DFQ-HIST模型中(zhōng)有几个(gè)关键步骤,对提升模型效果都有帮助:1)多输入:使(shǐ)用基础特征和alpha因子两类输(shū)入;(2)多标签:使用未(wèi)来5日、10日、20日收益率多个标签;(3)时序特征提取:GRU模型效果最好;(4)融合图信息:添加图信息后可 以显著提升多头(tóu)表现;(5)预定义(yì)概念选取:使用公司行业及(jí)主营业务构成数据(jù);(6)预定义概念修正:校正(zhèng)预定义概(gài)念的共享信息、挖掘缺失(shī)的股票概念(niàn)以(yǐ)及(jí)减少不太重要概念的影响可以提升模型性能;(7)隐藏概念挖(wā)掘:模型可(kě)以(yǐ)挖掘出在预定义概(gài)念之外的股票关联 ;(5)双重残差结构:移除预 定(dìng)义概念模块 、隐藏概念(niàn)模(mó)块、移除个(gè)体信息模块,或取消(xiāo)残差结构(gòu)都将降低模型 性能。

  • 合成因子绩效:在中(zhōng)证全(quán)指股票池中,HIST模型合(hé)成(chéng)因(yīn)子得分各项表现均明显最强(qiáng)。测试集(2020-2023年)上(shàng)rankic达 到(dào)17%rankicir达到1.34(未年化(huà)),20分组多头年化超额收益29.31%,月均 单边换(huàn)手73%。分(fēn)组单调性好。因子受行(xíng)业(yè)市值风(fēng)格的(de)影(yǐng)响较(jiào)小,因子中性化(huà)后表现依然很强,优(yōu)于其他模型。随机(jī)种子对(duì)全市场(chǎng)训练的模型结(jié)果影 响不(bù)大,5个路径下(xià)得到的因子值相(xiāng)关系数在90%左右。

  • 沪深300指数增强组(zǔ)合:2020年(nián)以来年化信息比达到2.27,年化(huà)对冲收益11.55%,年化跟踪误差(chà)4.87%,单边年换手7.45倍。

  • 中证500指数增强组合(hé):2020年 以来年化信息(xī)比达到 2.09,年化对冲收益13.13%,年化跟踪误差6%,单边年换手9.67倍。

  • 中证1000指(zhǐ)数增(zēng)强组合:HIST模型 在(zài)中证1000指增组合中表(biǎo)现突出:(1)整体(tǐ)表(biǎo)现(xiàn):2020年以来年化信息比(bǐ)达到3.6,年化对冲收益25.55%,年化跟踪误(wù)差(chà)6.39%,单边年换手10.06倍。(2)回(huí)撤情况:超额收益(yì)净值曲线走势平滑,未出现长时间失 效。超(chāo)额收益最大回撤仅为4.55%,出现在2023年(nián)4月,且回撤持续时间(jiān)很短。(3)分年表现:2020-2023每年均取得正超额,2023年对冲(chōng)收(shōu)益(yì)20%

风险提示

  • 量化模(mó)型(xíng)基于(yú)历(lì)史数据分析,未来存在(zài)失效(xiào)风险,建议投资者紧(jǐn)密跟踪模型(xíng)表现

  • 极端市场环境可能对模型效果造(zào)成剧烈冲击,导致(zhì)收益亏损。

说明:

本订阅号资料基(jī)于东方证券股份有限公司已发布证券研究报告制作。

证(zhèng)券研究报告:DFQ-HIST:添加图信息的选股因子(zi)挖掘系统——因子选股系列(liè)研(yán)究之一百

发布日期:2024年2月6日

分析师:杨怡玲 执业证书编(biān)号:S0860523040002

分析师:刘静涵 执业证书编号:S0860520080003

重(zhòng)要提(tí)示(向(xiàng)上滑动(dòng)浏览):

本订(dìng)阅号为东方证券(quàn)股份有限(xiàn)公司(以下称“东方(fāng)证券”)研究所金融工(gōng)程研(yán)究团队运营(yíng)的唯一订阅号,并非东方证券研究(jiū)报告的发布平台, 本订阅号仅转(zhuǎn)发东方证券已发(fā)布研究报告的部分内容或对报告进行的跟踪与解读。通过本订阅号发布的资(zī)料仅供东方证券研究所(suǒ)指定客(kè)户参考。因本订阅号无法设置访问限(xiàn)制,若您并(bìng)非 东方证券研究所指定客户(hù),为控制投资风险,请您请取消关注,请(qǐng)勿订阅、接收或使用(yòng)本(běn)订阅号中的任何信息(xī)。东方证(zhèng)券不因任何单纯(chún)订阅 本(běn)公众号的行为而将订阅人视为客户。

未经允许不得转载:橘子百科-橘子都知道 【东方金工·说深度】第15期:DFQ-HIST:添加图信息的选股因子挖掘系统

评论

5+2=