橘子百科-橘子都知道橘子百科-橘子都知道

【东方 金工·说深度】第15期:DFQ-HIST:添加图信 息的选股因子挖掘系统

【东方 金工·说深度】第15期:DFQ-HIST:添加图信 息的选股因子挖掘系统

(来源:东方金(jīn)工研究)

  • HIST模型(sHare Information for Stock Trend forecasting,基于图的 可通过挖掘概念 共享信息(xī)进 行股(gǔ)票趋(qū)势预测),由中山(shān)大学和微软(ruǎn)亚洲研究院合作在2022  1 【东方金工·说深度】第15期:DFQ-HIST:添加图信息的选股因子挖掘系统月发布于arXiv

  • DFQ-HIST模型在原文(wén)模型基础上进行修改和 优化,是一种新的股票趋势(shì)预测框(kuāng)架(jià),能够充分挖掘股票预定(dìng)义概念和隐藏概念(niàn)中的动态共享信息:1)刻画股(gǔ)票联动现象;(2)引入人工(gōng)预定(dìng)义概念,并且考虑(lǜ)到了预定义概念的不完备(bèi)性和动态(tài)变化性(xìng);(3)引入隐藏概念,进一步 挖掘股票关联信(xìn)息;(4)应用注意力机制,将个股信息和概念(niàn)信息进行融合;(5)加入股票(piào)时序特征(zhēng)编码模块(kuài),融合股票自身的历史时序特征信(xìn)息;(6)使用双重残(cán)差学习结构,处理(lǐ)不同模(mó)块的信(xìn)息。(7)相比其他(tā)常见图模型,HIST模型效果最好。

  • DFQ-HIST模型中(zhōng)有几个(gè)关键步骤,对提升模型效果都有(yǒu)帮(bāng)助:1)多输入:使用基础特征和(hé)alpha因(yīn)子两类输入;(2)多标签:使用未来5日、10日、20日收益(yì)率(lǜ)多(duō)个标签 ;(3)时序特征提取:GRU模型效果最好;(4)融合(hé)图信(xìn)息:添加图信(xìn)息后可以显(xiǎn)著提升多头表现(xiàn);(5)预定义概念选取:使用(yòng)公司行(xíng)业及主营业务构(gòu)成数据;(6)预定义概念修正:校正预定义概 念的(de)共享信息、挖掘缺失(shī)的股票(piào)概念以及减少(shǎo)不太重要(yào)概念(niàn)的影响可(kě)以(yǐ)提升模型性能;(7)隐藏概念挖掘:模型(xíng)可以挖(wā)掘出(chū)在(zài)预定(dìng)义概念之(zhī)外的股票关联(lián);(5)双重残差结构:移除预(yù)定义概念模块、隐藏概念(niàn)模块、移除个体信息模(mó)块,或取消残差结构都将降低模(mó)型性能。

  • 合成(chéng)因子绩效:在中证(zhèng)全指(zhǐ)股(gǔ)票池中,HIST模型合成因子(zi)得分各项(xiàng)表现均(jūn)明显最强。测试集(2020-2023年)上rankic达到17%rankicir达到1.34(未(wèi)年化(huà)),20分组多头年化超额收益29.31%,月均(jūn)单(dān)边换(huàn)手73%。分组单调性好。因子受行业市值风格(gé)的影响较小,因子中性化后表(biǎo)现依然很强,优于其他模型。随机种(zhǒng)子对全市(shì)场训练(liàn)的(de)模(mó)型(xíng)结果影 响不大,5个路径下得到的因子值相关系数在90%左右。

  • 沪深300指数增(zēng)强组合 :2020年以来年化(huà)信息(xī)比达到2.27,年化对冲(chōng)收益 11.55%,年化跟踪误差4.87%,单边年换手7.45倍(bèi)。

  • 中证500指数增强组合:2020年以来(lái)年化信息比达到2.09,年化对冲收益13.13%,年化跟(gēn)踪误差(chà)6%,单边(biān)年(nián)换手(shǒu)9.67倍(bèi)。

  • 中证1000指数增强组合:HIST模型在中证1000指增(zēng)组合中表现突出:(1)整体表现(xiàn):2020年以来(lái)年 化信息比达到(dào)3.6,年化对冲收益25.55%,年化跟踪误差6.39%,单边年换手10.06倍。(2)回撤情况:超额 收(shōu)益净(jìng)值曲线走势平滑,未出(chū)现长时间失效。超额收益最大(dà)回撤仅(jǐn)为4.55%,出现(xiàn)在2023年(nián)4月,且回撤(chè)持(chí)续时间很短。(3)分年表现:2020-2023每年均取得正超额,2023年对(duì)冲收益20%

风险提示

  • 量化模型基于历史数据分析,未来(lái)存在(zài)失效风险,建议投资者紧密(mì)跟踪模型表现

  • 极端市场环境可能对模型效果造成(chéng)剧(jù)烈冲击,导(dǎo)致(zhì)收益(yì)亏损。

说明:

本订阅号资料基于东方证(zhèng)券股份有【东方金工·说深度】第15期:DFQ-HIST:添加图信息的选股因子挖掘系统限 公司已发布证券研(yán)究报告制作。

证券(quàn)研究报告:DFQ-HIST:添加图(tú)信息的选股因子挖掘系统——因子选股系列研究(jiū)之一百

发布日期:2024年(nián)2月6日

分析师:杨怡玲 执(zhí)业证书编号:S0860523040002

分析(xī)师:刘静涵 执业(yè)证书编号(hào):S0860520080003

重要提示(shì)(向上滑动浏览):

本订阅号为东(dōng)方证 券(quàn)股份有限公司(以下称“东方证券”)研究所金融工程研究团队运营的唯一订阅号,并非东方证券研究报告的发(fā)布(bù)平台, 本订阅号仅(jǐn)转发(fā)东方证券已发布研究报告的部分内容或对报告进行的跟踪与解读。通(tōng)过本订阅号发(fā)布的资料仅(jǐn)供东方(fāng)证券研究所指定客户参考(kǎo)。因本订阅号(hào)无法设置访问限制,若您并非东方证(zhèng)券研究所指定客户,为控制投资风(fēng)险,请您请取消关注(zhù),请勿订阅(yuè)、接收或(huò)使用(yòng)本订阅号中的任(rèn)何信(xìn)息。东方证券不因任何单(dān)纯订阅本公众号的行为(wèi)而将订阅人(rén)视为(wèi)客户。

未经允许不得转载:橘子百科-橘子都知道 【东方金工·说深度】第15期:DFQ-HIST:添加图信息的选股因子挖掘系统

评论

5+2=