关系经济人类预测化学自然
中准网
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

Python3对球员做大数据降维(因子分析得分),为C罗找到

9月13日 倾城傷投稿
  众所周知,尤文图斯需要一座欧冠奖杯,C罗也还想再拿一座欧冠奖杯,为自己的荣誉簙上锦上添花。意甲霸主在意甲虽然风生水起,予取予求,但是在今年欧冠18决赛赛场上,被法甲球队里昂所淘汰,痛定思痛,球队解雇了主教练萨里,签约名宿皮尔洛,但是要想在欧冠赛场上夺冠,这还不够,球队还需要什么?没错,需要一名强力中锋,在正印中锋伊瓜因难堪大用的情况下,尤文图斯必须引进一名强力中锋。
  现在的问题是,在新赛季即将开始、疫情下球队银根紧缩的背景下,到底谁才是合格的引援人选?本次我们使用基于Python3的factoranalyzer库来对球员进行分析,试图寻找尤文图斯最适合引援的球员。
  首先我们来划定范围,先排除掉不可能的签约,比如拜仁的莱万多夫斯基,或者是热刺的哈里凯恩亦或是皇马的哈基姆本泽马,这三人都是世界级中锋,但是由于身价等多种因素导致他们加盟尤文图斯的可能性无限趋近于零。好吧,让我们现实点,巴萨的苏亚雷斯,罗马的哲科以及马竞的莫拉塔才是可能的人选,苏亚雷斯已经和巴萨闹翻,出走几乎是必然。莫拉塔下个赛季也不会出现在卡尔德隆球场,哲科在罗马虽然过得还不错,但是很明显他想要更高的荣誉。
  数据分析首先就得有数据,让我们来看看他们三个上赛季的比赛数据。
  首先来看看同在西甲的苏亚雷斯和莫拉塔:
  这里我们抽取中锋最重要的两项数据,进球数和进球转化率,可以看到在进球数相差4个的情况下,莫拉塔的进球转化率仅为14。5,落后于苏亚雷斯的19。
  作为中锋,除了进球,还需要一定的策应能力,这样就可以为C罗的后插上提供帮助:
  可以看到在策应能力上,莫拉塔也落后于苏亚雷斯,让我们再看看同在意甲的哲科和伊瓜因的数据:
  哲科在上个赛季无论是进攻能力还是策应能力都明显强于伊瓜因。
  现在我们来抽取一些高阶数据,这里以进球、转换率和助攻作为特征样本,当然了,如果愿意,也可以添加一些别的特征,这里只是简单演示一下,但是需要注意一点,数据建模只有有限的参考价值,因为球员的个人因素如:球员国籍,球员丑闻,球员个人目标定位(或期望值),球员伤病史及严重程度等等,这些都是没有参考数据的。
  所以,我们以纯能力数据为核心考量,球员转会身价及年薪这些成本因素不作年化成本计算,理论上也可以说是从主观角度根据转会新闻对此进行判断。同样,球员及所处球队的竞训水平也不作为参考数据,因为即便天赋再高的球员,长期和不在同一水平的球员或者教练员一起训练,也会导致与期望值有巨大偏差。
  将数据添加到数据集:importpandasaspdimportnumpyasnpfrompandasimportDataFrame,Series构建数据集mydata{进球:〔16,12,16,8〕,进球转化率:〔19,14,13,10〕,助攻:〔8,2,7,4〕,}dataDataFrame(mydata)data。index〔苏亚雷斯,莫拉塔,哲科,伊瓜因〕print(data)
  数据矩阵:进球进球转化率助攻苏亚雷斯16198莫拉塔12142哲科16137伊瓜因8104
  因子分析是通过对原始数据相关系数内部结构的研究,将多个指标转化为少量互相不相关且不可观测的随机变量(即因子),以提取原有指标的绝大部分的信息的统计方法。因子分析首先将原始数据标准化处理,建立相关系数矩阵并计算其特征值和特征向量,接着从中选择特征值大于等于1的特征值个数为公共因子数,或者根据特征值累计贡献率大于80来确定公共因子,求得正交或斜交因子载荷矩阵,最后计算公因子得分和综合得分。
  第一步,建立因子分析模型:fromfactoranalyzerimportFactorAnalyzer,RotatorfaFactorAnalyzer(rotationNone)fa。fit(data)print(fa。loadings)
  公共因子与原有变量指标之间的关联程度由因子载荷值体现,由于初始因子载荷矩阵结构不够简明,各个因子的含义不突出。为此采用方差最大法,使各个变量在某个因子上产生较高的载荷,而在其余因子上载荷较小。
  但是公共因子与原有变量指标之间的关联程度由因子载荷值体现,由于初始因子载荷矩阵结构不够简明,各个因子的含义不突出。为此采用方差最大法,使各个变量在某个因子上产生较高的载荷,而在其余因子上载荷较小,经过特征数据迭代收敛,得到旋转后因子载荷矩阵:rotatorRotator()print(旋转后矩阵:,rotator。fittransform(fa。loadings))
  随后我们可以简单看一下变量方差,即是每个原始变量在每个共同因子的负荷量的平方和,也就是指原始变量方差中由共同因子所决定的比率。变量的方差由共同因子和唯一因子组成。共同性表明了原始变量方差中能被共同因子解释的部分,共同性越大,变量能被因子说明的程度越高,即因子可解释该变量的方差越多。共同性的意义在于说明如果用共同因子替代原始变量后,原始变量的信息被保留的程度。print(fa。getcommunalities())
  也可以查看因子相关矩阵和特征值:print(fa。geteigenvalues())
  当然了,我们的最终目的是根据因子模型对各个球员进行综合打分,最后使用各个因子方差贡献率占3个因子方差贡献率的比重作为权重进行加权汇总,得到各个球员的综合得分F,即:defF(factors):returnsum(factorsfa。getfactorvariance()〔1〕)
  之后就可以在矩阵中依次进行计算:scores〔〕foriinrange(len(fa。transform(data))):newF(fa。transform(data)〔i〕)scores。append(new)print(scores)
  得到分值数组:〔0。7294004536510521,0。2958329655707666,0。530110265958429,0。9636777540387146〕
  然后我们就可以为原矩阵添加一列数据:data〔综合打分〕scoresprint(data)
  得到新矩阵:进球进球转化率助攻综合打分苏亚雷斯161980。729400莫拉塔121420。295833哲科161370。530110伊瓜因81040。963678
  同时可以指定按照新字段列进行排序,方便数据展示:datadata。sortvalues(by综合打分,ascendingFalse)
  得到排序后的矩阵:进球进球转化率助攻综合打分苏亚雷斯161980。729400哲科161370。530110莫拉塔121420。295833伊瓜因81040。963678
  如果愿意,我们也可以对矩阵进行可视化操作,这里以水平柱状图为例子:importmatplotlib。pyplotaspltimportmatplotlibmatplotlib。rcParams〔font。sansserif〕〔SimHei〕matplotlib。rcParams〔axes。unicodeminus〕Falseplt。barh(range(4),scores,height0。7,colorsteelblue,alpha0。8)plt。yticks(range(4),〔苏亚雷斯,莫拉塔,哲科,伊瓜因〕)plt。xlim(1,2)plt。xlabel(分数)plt。title(引援打分)forx,yinenumerate(scores):plt。text(y0。2,x0。1,sy)plt。show()
  根据综合评分,苏亚雷斯无疑是最佳人选,退而求其次是哲科,第三选择是莫拉塔,无论如何,他们三位的综合能力都要比队内的伊瓜因都要强,从这个角度来看,就算选择莫拉塔,也是比让伊瓜因留队更好的选择。
  结语:必须指出的一点是,球员特征所形成的数据结果,绝对不能成为做决策的主要依据,只能作为参考而存在,过度依赖数据往往可能适得其反,比如曾被誉为足坛数据战术大师的贝尼特斯,其根据数据排首发阵型的操作曾经聒噪一时,可现在呢?只能混迹于中超联赛。截止到本文发布的2020年9月24日凌晨,尤文图斯俱乐部通过租借的形式引进莫拉塔,而苏亚雷斯600万英镑转会马德里竞技,哲科留队。尤文图斯选择了因子分析模型分数不高的莫拉塔,莫拉塔能否帮助C罗圆梦?新赛季欧冠谁执牛耳?让我们拭目以待。
投诉 评论 转载

大平原(二百九十三)冬至冬至文赵玉英冬至气温骤降,凛冽的有些让人窒息。让人窒息的不仅仅是低温,压在头顶那片橘红色一路飘升的疫情数据线更让人惴惴不安。病毒肆虐,家人一一中招,连几个月的小宝宝……带你一文搞懂Docker01Docker概述Docker简介Docker是基于Go语言实现的云开源项目。Docker的主要目标是:Build,ShipandRunAnyApp,Anywhe……樱井政博透露未来动向希望大家把我忘掉一段时间《任天堂明星大乱斗特别版》的开发在2021年正式结束。很多玩家在体验最终版游戏内容的同时,更好奇制作人樱井政博的下一步计划(虽然近年来网友不断地告诉樱井政博工作不要太过劳累,应……毛姓女艺人把一手烂牌打成王者的当红女星01hr2013年,毛晓彤拍摄电视剧《淑女之家》时,认识了小1岁的演员陈翔,也就是这个时候,两人对彼此悄悄萌生了爱意。同年,两人又在于正版《新神雕侠侣》中拍戏,随着日久相……Python3对球员做大数据降维(因子分析得分),为C罗找到众所周知,尤文图斯需要一座欧冠奖杯,C罗也还想再拿一座欧冠奖杯,为自己的荣誉簙上锦上添花。意甲霸主在意甲虽然风生水起,予取予求,但是在今年欧冠18决赛赛场上,被法甲球队里昂所淘……中超北京国安大震荡,国足归化神锋惨遭清洗,神锋火线复出北京时间8月4日,中超联赛第二阶段即将开战,很多球迷也是期盼很久,而且能够去现场观战也是很久没有过的事情了,会让球迷感到很兴奋。大多数球队还是在本地的场地打主场比赛,只有一小部……粤企500强总营收首破17万亿,华为腾讯分列第4和第510月12日,广东省企业联合会、广东省企业家协会发布《2022广东500强企业发展报告》(以下简称《报告》)及2022广东企业500强等榜单。《报告》显示,2022年广东……济南50余家企业将出海抓订单稳市场来源:【济南日报爱济南】山东各市纷纷奔走在出海抓订单的路上。12月15日,新黄河记者从济南市商务局获悉,50多家济南企业将在市商务局组织下出海寻求贸易合作。市商务局……今日大盘上涨,下跌家数却超过3000多,行情真的好吗?今日大盘上涨,下跌家数却超3000多,行情真的好吗?听听股市大V们的盘后点评及预测吧1。索问思粉丝99万股市观点:聪明人不要随时随地买股票,一年买两到三次,其实就够了。平……香满天艳满城《菊盈寒秋》风凉,日暖天空澄澈的密匝纯粹却又是大写意的辽阔云栖息在天际,朴拙散淡梧桐日渐憔悴也许是因为恐惧,枝条就要萧瑟,叶子更是要枯黄零落……区块链圣经了解区块链技术的基本规则区块链技术席卷全球,颠覆了行业并改变了我们对数据和交易的思考方式。随着区块链的普及不断增长,了解管理该技术的基本规则非常重要。在本文中,我们将仔细研究区块链圣经以及使区块链成为……美强惨羽生结弦为国争光却惨遭母国打压,与我国选手相撞被网暴一、就算你恨毒了日本,也无法拒绝这个名叫羽生结弦的日本人。2017年,在花滑世锦赛的颁奖典礼中,我国名将金博洋不慎拿反国旗。一旁的羽生结弦看到后,当即就滑到这……
民营企业财务风险的主要原因穷的造句用穷的造句大全局机关办公室工作总结梅花香自苦寒来游戏中的恶趣味减肥跑步不出汗可以么安全地造句用安全地造句大全治愈的话对朋友煽情的话妊娠高血压有哪些治疗方法你的苹果6过时了别听那鬼话三消息赵锦洋女友晒合照郭昊文获发展联盟邀请小丁获免测
尊老敬老演讲稿公司月度党建工作汇报什么牛奶比较好(牛奶买什么品牌的好)夏季小儿感冒原因想起徐志摩之五喀纳斯游记小学作文vivox6手机能查定位吗(怎么查手机定位那个人在哪)企业使用典信供应链管理系统的好处工作轻松还有看不完的书?揭秘童书编辑的日常41岁的斯科拉加索尔以及姚明汽车发生剐蹭怎么处理吃梨子会上火吗别以为含糖高的水果都会上火

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州