【东方金工·说深度】第15期:DFQ-HIST:添加图信息的选股因子挖掘系统
(来源:东方金工研究)
HIST模型(sHare Information for Stock Trend forecasting,基于图的可通过挖掘概念共(gòng)享信(xìn)息进行股(gǔ)票趋势预测),由中山大学(xué)和(hé)微(wēi)软亚洲(zhōu)研究(jiū)院合作(zuò)在2022 年 1 月发布于arXiv。
DFQ-HIST模型在原文模型(xíng)基础上进(jìn)行修改和(hé)优化(huà),是(shì)一(yī)种新的股票趋势 预测(cè)框架,能够(gòu)充分挖掘股票预定义概念和隐藏概念中的动态共享信(xìn)息:(1)刻画股票联动现象;(2)引入人工(gōng)预(yù)定义概念,并且考虑(lǜ)到了预定义(yì)概念(niàn)的不完备性和动态变化(huà)性;(3)引(yǐn)入隐藏概念,进一步挖掘股票关联信息;(4)应用注意力机制,将个(gè)股信息和概念(niàn)信息进行融(róng)合;(5)加入(rù)股票时序特征(zhēng)编码模块,融合股票(piào)自身的历史时(shí)序特征信息;(6)使(shǐ)用双重残差学(xué)习结构,处理不同模块的信息。(7)相比其他常见图模型,HIST模型效果最好。
DFQ-HIST模型中有几个关键步骤,对提升模型效果都有帮助:(1)多输入:使用基础特征(zhēng)和alpha因子两(liǎng)类输入;(2)多标签:使用未来(lái)5日、10日、20日收(shōu)益率多个标签;(3)时序特征提取(qǔ):GRU模型效果最好;(4)融合(hé)图(tú)信息(xī):添加图信息后可(kě)以显著提升多头表现;(5)预定义概念选取:使用公司行业及(jí)主营业务(wù)构成数据;(6)预定(dìng)义概(gài)念修正:校正预定(dìng)义概念的共享信息、挖掘缺失(shī)的股(gǔ)票概(gài)念以及减少不太重要概念(niàn)的影响可以提升模型性能;(7)隐藏概(gài)念挖掘:模型可以挖掘出在预定义概念(niàn)之外(wài)的股票关联(lián);(5)双重残差(chà)结(jié)构:移(yí)除预定义概念(niàn)模(mó)块、隐藏概念模(mó)块(kuài)、移除个体(tǐ)信息模块,或取消(xiāo)残差结构都将降低模型性能。
合成因子绩(jì)效:在中证全指(zhǐ)股票池中,HIST模型合成因子得分各项表现均明显最强。测试集(2020-2023年)上rankic达到【东方金工·说深度】第15期:DFQ-HIST:添加图信息的选股因子挖掘系统>17%,rankicir达到1.34(未(wèi)年化),20分组多头年化超额收益29.31%,月均单边换手73%。分组单调(diào)性好(hǎo)。因子受(shòu)行业(yè)市值风格的影(yǐng)响较小,因子中性化后表现依(yī)然很强,优于其他模型。随机种子对全市场训练的模型结果影(yǐng)响不大,5个路径下得到的因子值相关系数在90%左右(yòu)。
沪深300指数增强组 合:2020年以(yǐ)来年化信息(xī)比达(dá)到2.27,年(nián)化对冲收益(yì)11.55%,年化跟踪误差(chà)4.87%,单边年换手7.45倍。
中证500指数增(zēng)强 组合:2020年以来年(nián)化信(xìn)息比(bǐ)达到2.09,年化对冲收益13.13%,年化跟踪误差(chà)6%,单(dān)边年换手(shǒu)9.67倍。
【东方金工·说深度】第15期:DFQ-HIST:添加图信息的选股因子挖掘系统s-style="font-L strong-Bold color0">中证1000指数增强(qiáng)组(zǔ)合:HIST模型在中证1000指增组合中表现突出:(1)整体表现:2020年以来年化信(xìn)息比达到3.6,年化(huà)对冲收益25.55%,年化跟踪误差(chà)6.39%,单边年换手10.06倍。(2)回撤情况(kuàng):超额收益净值曲(qū)线走势平滑,未出现长时间失效。超额收益最大回撤仅为4.55%,出现在2023年4月(yuè),且回撤(chè)持续时间很短(duǎn)。(3)分年表(biǎo)现:2020-2023每年均取得(dé)正超额,2023年对冲收益20%。
风险提示
量化模型 基于历史数据分析,未(wèi)来存在失效风 险,建议投资者紧密跟(gēn)踪模型表现(xiàn)。
极端市场环境可能对模型效果造成剧烈冲击,导致收益亏损。
说明(míng):
本订阅号资(zī)料基于(yú)东方证券股份有限公司已发布证券研究(jiū)报(bào)告(gào)制作。
证(zhèng)券研(yán)究报(bào)告:《DFQ-HIST:添加(jiā)图信息 的选股因子挖掘系统——因子选股系(xì)列研 究(jiū)之(zhī)一百》
发(fā)布日 期:2024年2月6日
分析师:杨怡玲 执业(yè)证书编号:S0860523040002
分析师:刘静涵(hán) 执业证书编号:S0860520080003
重要提示(向上(shàng)滑动浏览):
本订阅(yuè)号(hào)为东方证券股份有限公司(以下称“东方(fāng)证券”)研究所金融工程研究团队运营的唯(wéi)一(yī)订阅号,并非东方证券(quàn)研究报告(gào)的发布(bù)平台, 本订阅号仅转发东方证券已发布研究报(bào)告的部分内容或对报告进行(xíng)的跟踪(zōng)与解读。通过本订阅号发布的资料仅供东方证券研究所指定客户(hù)参考。因本订阅(yuè)号无法设置访问限制,若您并非东方证券研究所指定客户,为控制投资风险,请您请取消关注,请勿订阅、接(jiē)收或使用本订阅号中(zhōng)的任何(hé)信息。东方(fāng)证券不因任何单纯订阅本公众(zhòng)号的行(xíng)为而将 订(dìng)阅人视为客户。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了