基于关联规则算法的多因子打分法模型因子的选择与赋

自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

基于关联规则算法的多因子打分法模型因子的选择与赋

12月16日顾昀汐投稿

　　岳书凝邵波王健
　　摘要：目前我国的量化投资发展迅猛，其中最为热门的便是多因子模型策略。如今已经有不少成功的量化研究是以多因子选股模型为基础，基于打分法构建的模型策略，以实际的应用验证了其可行性。但是多数的多因子模型仍是以投资组合理论为指导进行构建的，而本文考虑到我国国情以及A股的实际情况，则创新性地从市场实际的历史表现数据出发，结合时下最新兴的大数据分析，利用FPGrowth算法发掘多种因子数据表现与收益的关联规则，反向选择出最优因子和最优权重，构建更加针对市场特征的实用型投资策略。
　　关键词：FPGrowth关联规则算法；多因子打分法模型；因子选择；赋权
　　尽管从20世纪90年代到现在，我国证券市场日益趋于完善，国内外众多学者提供了很多理论上近乎完美的投资模型，但是在我国目前市场尚无法满足这些模型的严格假设条件下，这些在国外运用成熟的量化投资模型在中国市场上并不定完全有效，真正能应用于实践的并不多。而要想在A股市场上获取成功有效的持续的超额收益，就需要从我国市场的实际情况出发，探索真正符合A股市场的本土化的投资模型。因此，本文将使用FPGrowth关联规则算法研究如何选择有效因子以及如何分配多因子权重，构建一个真正的符合中国A股市场特征的个性化多因子选股模型，构建在我国资本市场上可获得超额收益的投资策略。
　　一、算法描述和多因子模型
　　（一）FPGrowth关联规则算法
　　FPtree的构建，也就是将数据集进行压缩，是一种紧凑的数据结构，与计算机学科中的树结构相似。不同的是FPtree通过链接（link）连接相似的元素，在条件FPtree的基础上进行频繁项集的递归挖掘，频繁模式由条件模式基中去除小于支持度计数的前缀路径组成。此外FPGrowth算法将数据集压缩到FPtree中，从而大大地减少了扫描数据库的次数，以及存储大量候选集的开销。
　　图1FPtree的实例
　　（二）多因子模型构建
　　1。候选因子库的创建
　　本文考虑到因子指标的普遍性、数据可得性以及区别度等标准，选择并获取如下数据类型并根据FPGrowth算法的原理加以分组分类
　　表1（时间区间：六个月）：
　　2。数据汇总及预处理
　　由于各个描述性因子所衡量的单位不同，导致因子数值范围差异较大，因此在进行因子分析之前，必须对其进行标准化，本文将数据进行minmax标准化处理，即是通过对原始数据的线性变换，按照比例缩放，使之落入一个小的特定区间，如〔1，1〕，由此才能进一步导入算法来分析数据。公式近似为：
　　x（xxmean）（xmaxxmin）
　　3。FPGrowth算法的实现
　　本文运用Java构造FPtree，创建FPtree的具体步骤如下：
　　本文运用Java构造FPtree，创建FPtree的具体步骤如下：
　　首先创建FPtree的根结点，标记为NULL。
　　对于数据集中的每个事务执行以下操作：对事务中的频繁项按照频繁1项集L中的顺序进行排序，排序后的频繁项表记为IPPI，其中p是第一个元素，而P是剩余元素的表。调用insert。tree｛〔pPI〕｝。
　　具体的执行过程如下：如果T有子女N使得Nitemnamep。itemname，则N的计数增加1；否则创建一个新结点N，将其计数设置为1，链接到它的父结点T，并且通过结点链结构将其链接到具有相同itemname的结点。如果P非空，递归地调用insertree（P，N）。
　　按照支持度递减的顺序建立一一个项头表，这样一颗完整的频繁模式数就构造完成。注：本文根據投资需求，只针对性的获取以A组数据（涨跌幅）为表头，与其他因子的关联度。即排除无关的关联度分析，只得到体现各因子与收益率关系的FPtree。4。经典多因子打分法模型改进考虑到市场的多变性和不同的因子特性，本文将等权重打分改进为赋权打分。经典的多因子打分法模型实质是计算综合因子（得分）即因子标准化后等权重求和的选股过程。本文则根据因子暴露与收益率之间的关系，兼顾因子的偏好方向，成比例地形成投资组合。弥补了经典打分法因权重不定带来的不稳定性。
　　二、应用与检验
　　（一）赋权多因子模型的构建
　　从wind金融终端数据库导出沪深300个股票六个月前（2019。05）的候选数据，将其标准化处理后导入FPGrowth算法进行挖掘，支持度设为50，调仓频率（每月调仓一次）。
　　得如下结果：
　　表2算法挖掘的上跌幅与各因子指标结果
　　关于该结果的解释分析：
　　1。在支持度下，不存在与A1、A4关联的因子，因此在该时间段多数股票涨跌幅适中，无频繁大涨大跌。
　　2。由于A2为跌幅分组，所以不列入买点分析范围内。
　　3。通过计算得出，A3关联占比呈现近似于3：0：2：1。5。即不选择C所代表的因子，且得出因子权重。
　　在同花顺mindgo平台上，利用多因子打分法策略，加入赋权进行模拟操作。
　　设定最大持股数（30只）、初始金额（10，000，000元）
　　（二）模型回测结果分析
　　1。模型回测结果
　　图2收益曲线
　　图3权重和等权重收益率对比
　　2。回测结果分析
　　在回测期内，改进后的FPGrowth算法赋权多因子模型收益率为9。49，收益率均超过基准收益和等权重模型，且各项指标的表现较于等权重模型均更为优化，可认为改良后模型因子选择及赋权有效，具有更强的盈利能力和普适性。
　　三、结论和存在的问题
　　本文通多运用FPGrowth算法，探究指标变化与收益率的直接关系，个性化的挑选最合适的有效因子；同时验证了且采用多因子选股模型时，选取的有效因子权重也不是固定不变的。本文模型可以针对不同的板块、周期、市场的实际情况和宏观经济状况进行不断的更新和调整，以保证其持续有效性，有针对性地获取更个性化的投资收益。同时在模型构建的过程中，也发现了一些日后可进行优化的问题。
　　由于数据的可得性和计算量限制，只能选取部分指标，今后可以考虑加入更全面的技术指标，如KDJ、BOLL等。考虑到程序运行量较大，数据选取时间范围较小，只能针对短线投资，后续可针对长期庞大数据量改进算法。受到FPgrouth算法的局限性，数据只能进行离散处理，因此不能对数据进行连续性的分析。
　　四、展望
　　本文所述可以为量化投资提供一个新的思路，与以往基于经验判断定性选择模型中的因子等权重分配不同，而是运用大数据分析，从市场表现出发，反向思考，创新性的改进经典的多因子打分法策略。该策略除了能够更深程度的运用于量化选股，还可以针对个股特性及其所处在的周期一对一分析，使投资者对于所选中的优质股有更精准的操作。同时基于FPGrowth关联规则算法的多因子打分法选择及赋权改进，還可以扩展向宏观经济分析等其他金融领域，可以实时、准确、多维度、智能化的为政府和研究机构的政策制定、经济分析提供有力的数据支持。甚至可以应用至商业、医疗、教育、农业等其他领域。
　　参考文献：
　　〔1〕朱涛。基于FPgrowth关联规则挖掘算法的研究与应用〔D〕。南昌大学，2010（01）07。
　　〔2〕刘艺。张海涛。刘奇燕。石硕。基于分解数据库的FPgrowth算法关联规则研究〔J〕。计算机与数字工程，2018（07）13061416。
　　〔3〕苗苗。多因子选股模型在投资组合管理中的应用研究〔D〕。南京审计大学，2018（05）：17。
　　〔4〕杨世林。基于聚宽量化投资平台的股票多因子策略应用杨世林〔D〕。浙江大学，2018（06）。
　　〔5〕林文强。加性风险模型下量化投资策略及其实现〔J〕科技经济导刊，2019，27（10）46。
　　〔6〕黄东宾。有效因子综合偏好强度与CVaR整合优化模型〔J〕运筹与管理，2019，03（3）2430。
　　〔7〕赵子铭。基于有效因子复合检验法的多因子选股策略〔N〕广州航海学院学报，2019，09（3）7478。
　　通讯作者：邵波（1980），男，杭州，讲师，博士，微生物量化金融研究，量化金融大数据挖掘。

投诉评论转载

声音的用途有哪些声音的十大神奇用途导语：无论我们走到哪里，我们都被声音包围着。虽然我们通常认为它们的存在是理所当然的，但它们有时可以以我们意想不到的方式被使用。接下来呢就由探秘志小编为大家揭秘声音的十大神奇用途……村民在河里发现一头大肥猪拉上岸后才发现是美人鱼一场大雨过后，村子旁边的河水暴涨，很多平时见不到的鱼虾蟹都被冲出来了，还有很多死蛇也出来了，村民们高兴的把死蛇带回家去炒着吃。上图为广西某地村民，当地人爱吃蛇，觉得养生又……喜鹊姑娘与火把节有个漂亮能干的罗姿姑娘，很早就与阿龙相爱，感情很深。附近有十二个部落的儿子来提亲，其中以土官老爷最凶，说是如果不答应，就要血洗山寨，让全村遭殃。姑娘无奈，答应于六月二十四……单店日销元便利店之王你学不会在零售业有一种说法：世界上有两种便利店，7Eleven便利店和其他便利店。在全球开6万家店，店铺数世界第一，单店日均36444元，这就是号称零售业标杆的711的漂亮战绩。中国的……退市死而复生造车主们的中场战事说到底，这场战事能不能继续，还是钱的问题。无论是马斯克、蔚来的李斌和贾跃亭，谁都不能说获得了胜利。在李安电影《比利林恩的中场战事》里，大兵林恩回到家乡并卷入了一次宣传活动……东北烧茄子的家常做法烧aclasstaghrefwiki10160IaSUT0V4。html茄子a是一道传统风味特色菜，以其独有的咸香味道，深受大众喜爱。烧茄子的做法也非常的多，小编为大家介绍的是……工作述职报告工作述职报告由好范文网的会员投稿精心推荐，小编希望以下7篇范文对你的学习工作能带来参考借鉴作用。第1篇：工作述职报告工作述职报告的写法与格式是什么？请参考以下这篇范……基于关联规则算法的多因子打分法模型因子的选择与赋岳书凝邵波王健摘要：目前我国的量化投资发展迅猛，其中最为热门的便是多因子模型策略。如今已经有不少成功的量化研究是以多因子选股模型为基础，基于打分法构建的模型策略，以实际的……班组建设展板模板精选多篇第1篇第2篇第3篇第4篇第5篇更多顶部第一篇：展板模板第二篇：条幅展板申请模板第三篇：展板个人信息模板第四篇：班组建设典型经验编写模板第五篇：党风廉政建设工作展板内容1更……商法对我国公司会计领域的影响【摘要】在当前的时代背景下，部分企业的整体公司治理水平较弱。部分企业领导层不仅不注重公司财务的管理，而且往往忽略财务领域合法合规性要求，不重视商法的运用和影响，从而从根本上抑制……事业单位登记档案管理规范化探索【摘要】事业单位登记档案管理有着为事业单位提供便利服务的重要意义，也能够为将来事业单位进行改革提供相关的参考建议，还可以为社会提供有关的法律依据。因此，事业单位登记档案管理工作……关于试验场操控路干的建设情况及创新设计研究徐高鹏王晓东【摘要】本文对国内外试验场的操控路已建情况进行了较为系统、全面的叙述和疏理，从工艺要求和设计布局、设计创新方面对干操控路的设计进行了探讨，研究了汽车试验场操控……

<<<<<<－>>>>>>

羊毛党软件搬砖方法让你羊毛薅个够红楼解梦是解读红楼梦的学术论文好家风好家训格言结婚前发现女友不是处我不娶了分男人也会内分泌失调大症状需警惕结婚长命灯秋季准妈妈的保健要点款宝宝抗病食谱推荐种提高男人内力的性爱技巧想在北京北京冬奥闭幕式亮相吗有个机会给你封神演义五行上将有谁小娥是其中的谁有孩子怎么挽回婚姻

智能音箱这一年飙增15倍！四巨头哭着收割市场资源管理器菜单打不开怎么办一次考试是否老放屁就是肠胃不好经常放屁的原因分析世界上最大的宫殿，缅甸曼德勒皇宫（占地面积400万平方米）中戏校花护肤全攻略五月孩子长得快生涯巧安排手机导航怎么收流量费即事俗语“男怕三摇头，女怕大步走”，啥意思？。。。梅拉尼娅亮相依然好美！穿12公分的鞋太厉害，4万5的香奈儿包那一抹色彩

友情链接：中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州