沧州三亚菏泽经济预测自然
投稿投诉
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产
菏泽德阳
山西湖州
宝鸡上海
茂名内江
三亚信阳
长春北海
西安安徽
黄石烟台
沧州湛江
肇庆鹤壁
六安韶关
成都钦州

使用抓取同花顺资金流数据

10月26日 圆通道投稿
  今天我们通过一个例子来介绍python爬取数据的一般步骤,用到的工具包括python的经典模块requests和BeautifulSoup,另外结合刚学习的任务流工具TaskFlow来完成代码开发。
  我们先来看一下要爬取的数据,网址是http:data。10jqka。com。cnfundsgnzjl,通过chrome的开发者工具分析我们可以比较容易找到后台数据加载网址为
  http:data。10jqka。com。cnfundsgnzjlfieldtradezdforderdescpage{pagenum}ajax1free1
  其中pagenum的位置为要查询第几页的数据,在网页上看到概念一共有6页数据,所以pagenum取值为16
  图示1
  这里有个小技巧,可以先点击图示1左上角的清空按钮,把已经加载的网址先清理掉,然后在原始网页上点第二页,就能看到图片左下角新加载的网址,点开右边Preview看到资金流数据相关的内容,就能确定这个网址是用来加载数据的。
  在chrome浏览器中输入http:data。10jqka。com。cnfundsgnzjlfieldtradezdforderdescpage1ajax1free1,并打开chrome开发者工具,在网页源码中找到数据所在table标签为
  。。。
  
  抓取数据的完整源码如下
  importtimeimportrequestsfrombs4importBeautifulSoupfromtaskflowimportenginesfromtaskflow。patternsimportlinearflowfromtaskflow。taskimportTaskREQUESTHEADER{UserAgent:Mozilla5。0(MIntelMacOSX10142)AppleWebKit537。36(KHTML,likeGecko)Chrome78。0。3904。97Safari537。36}classMoneyFlowDownload(Task):下载资金流数据数据源地址:http:data。10jqka。com。cnfundsgnzjlBASEURl{concept:http:data。10jqka。com。cnfundsgnzjlfieldtradezdforderdescpagesajax1free1,}defexecute(self,bizdate,args,kwargs):forname,baseurlinself。BASEURl。items():爬取数据的存储路径dtpathdatass。csv(bizdate,name)withopen(dtpath,a)asf:记录数据文件的当前位置posf。tell()f。seek(0)linesf。readlines()读取文件中的全部数据并将第一列存储下来作为去重依据,防止爬虫意外中断后重启程序时,重复写入相同crawledlistlist(map(lambdaline:line。split(,)〔0〕,lines))f。seek(pos)循环500次,从第一页开始爬取数据,当页面没有数据时终端退出循环foriinrange(1,500):print(startcrawls,s(name,baseurli))websourcerequests。get(baseurli,headersREQUESTHEADER)soupBeautifulSoup(websource。content。decode(gbk),lxml)tablesoup。select(。Jajaxtable)〔0〕tbodytable。select(tbodytr)当tbody为空时,则说明当前页已经没有数据了,此时终止循环iflen(tbody)0:breakfortrintbody:fieldstr。select(td)将每行记录第一列去掉,第一列为序号,没有存储必要record〔field。text。strip()forfieldinfields〔1:〕〕如果记录还没有写入文件中,则执行写入操作,否则跳过这行写入ifrecord〔0〕notincrawledlist:f。writelines(〔,。join(record)〕)同花顺网站有反爬虫的机制,爬取速度过快很可能被封time。sleep(1)ifnamemain:bizdate20200214tasks〔MoneyFlowDownload(moneyflowdatadownload)〕flowlinearflow。Flow(thsdatadownload)。add(tasks)eengines。load(flow,store{bizdate:bizdate})e。run()
  执行程序后,在dtpath位置已经存储了概念的资金流数据,文件名为20200214concept。csv,内容大致如下:
  钛白粉,1008。88,6。29,7。68,6。21,1。47,7,金浦钛业,10。04,2。96磷化工,916。833,2。42,37。53,34。78,2。75,28,六国化工,9。97,4。08光刻胶,1435。68,2。40,43。51,44。31,0。80,20,晶瑞股份,10。01,42。99
  此时就完成了同花顺概念分类的资金流数据的爬取,之后可以每天定时启动任务抓取数据进行分析。
投诉 评论

秦皇岛的两处最佳观鸟圣地七月本不是秦皇岛最好的观鸟季节,然而在这片得天独厚的滩涂,仍有群鸟飞翔,白色的翅膀如同即将入海的风帆在水面划过。紧邻鸽子窝公园的北戴河海滨湿地,是闻名世界的观鸟圣地。在泰信软件……抗击疫情英雄人物事迹致敬抗疫英雄手抄报内容没有一个冬天不可逾越,也没有一个春天不会到来。面对这场疫情,希望我们共同坚定信心迎难而上。让我们携起手来,打赢疫情防控的阻击战,静待春暖花开的日子早日到来!抗击疫情英雄人……符合用户认知的交互才是最自然的交互为什么有时候只用看一眼就知道这两个东西是什么,如何操作?其实这就是物品所具备的预设用途。家里一岁两个月的宝宝喜欢用手机做两件事情:按HOME键,点亮屏幕。按住……闲话移动支付流程设计当一款工具类产品和品牌电商结合起来的时候会发生什么?平台流量电商现金流或许这样的方法可以让产品自给自足,或者在某方面有更大的可能性,但不管怎样,还是先把用户做好,才……地产入门商业地产和住宅地产到底有什么区言雀,微信公众号:地产三日侃对比商业地产和住宅地产这两种事物之前,是要了解并清楚这两种事物,首先我们是要确认这一点;如果不了解,那所有的对比都是没有意义的,这是常识;但是……使用抓取同花顺资金流数据今天我们通过一个例子来介绍python爬取数据的一般步骤,用到的工具包括python的经典模块requests和BeautifulSoup,另外结合刚学习的任务流工具TaskF……樱桃如何防治金龟子类害虫一般危害樱桃树的金龟子类害虫,主要有铜绿金龟子、苹毛金龟子和黑绒金龟子,这类害虫可以啃食樱桃花蕾、花器、嫩枝、幼芽,有的还会危害根系,以下三农网将详细介绍金龟子类害虫对樱桃树的……大秘教你如何起草领导讲话稿技巧篇(一)写前三问。写稿子前,有三个问题要自己:一问写这篇稿子有什么目的,要解决什么问题?二问要用什么素材,表现什么内容?三问属于什么文体,应该突出什么特点?这三个问题搞清楚……道德许可效应善行之后的恶行普林斯顿大学心理学家贝努瓦莫林和戴尔米勒研究刻板印象和决策过程时,问普林斯顿大学的本科生两种类别的问题:第一个类别是:命题一:大多数女人真的不聪明;命题二:大……九宫挨星掌诀一坎、二坤、三震、四巽、五中、六乾、七兑、八艮、九离。一为壬子癸,二为未坤申,三为甲卯乙,四为辰巽巳,五为戊己,六为戌乾亥,七为庚酉辛,八为丑艮寅,九为丙午丁。以上二十四山分为……长什么面相的女人容易被男人宠爱现在可以说遍地是美女,不管是天然的,还是整出来的,看上去都很美,都很漂亮。可都是美女,命运却截然不同,有的美女总是被爱情伤害,有的美女却能够被身边的男人小心翼翼的呵护,没有伤害……你戴黑帽子了吗生活中,你戴黑帽子了吗?想要知道答案的话,快来做个小测试测试一下吧!【题目】一群人开舞会,每人头上都戴着一顶帽子。帽子只有黑白两种,黑的至少有一顶。每个人都能看到其……
男人多碰这里岁还肾强体壮十四代清酒吃苦荞都有哪些好处胎菊茶的功效与作用有哪些你为啥瘦不下来也许是走进了这些误区酒店厨房设备打蛋机好用吗大学生骨折能报销多少外墙防水胶有毒吗控油洗发露排行榜怀孕初期到底该如何美容泄露他人身份证信息判什么刑流产后吃什么对眼睛好马冬梅是什么梗DIY短发刘海新花样在我国劳务合同是仲裁还是诉讼女生想要高质量独处,这4件小事让你幸福感满满我的赛车500字作文Unit4Whereisit?的教案设计王阳明:你对了,世界就对了初中议论文柔者成刚励志故事从生活中寻找乐趣温柔的母爱中考满分作文我心灵的甘露中国建筑中国铁建,估值处于历史什么位置?

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找