关系经济人类预测化学自然
中准网
自然科学
知识物理
化学生物
地理解释
预测理解
本质社会
人类现象
行为研究
经济政治
心理结构
关系指导
人文遗产

口碑扑街告诉你完美关系为何表

5月21日 失了心投稿
  CDA数据分析师出品
  【导语】:今天我们聊聊国产职场剧《完美关系》,Python技术部分可以直接看第三部分。
  Showmedata,用数据说话
  今天我们聊聊职场剧《完美关系》
  点击下方视频,先睹为快:
  最近一连出了好几部职场剧,有孙俪主演讲述房地产行业的《安家》,李易峰主演讲律师的《我在北京等你》,以及佟丽娅、黄轩主演围绕公关行业展开的《完美关系》。
  其中,《安家》是翻拍自高分日剧《卖房子的女人》,《我在北京等你》讲的是一名律师奋斗的故事,《完美关系》则是国产职场剧涉及的又一全新行业公关。
  那么这三部剧的口碑如何呢?
  截止到目前为止,《安家》在豆瓣的评分为6。2分,《我在北京等你》豆瓣5。2分,《完美关系》为3。9分。都不是特别好的成绩。
  《完美关系》播出后更是有公关行业的小伙伴吐槽:我们不想被这么代言啊!
  那么《完美关系》到底是哪里差强人意呢?今天我们就先聊聊这部《完美关系》
  01:hr近年频频扑街的
  国产职场剧
  近年来,推出的国产职场剧还真不少,涉及的行业从地产、互联网、医疗、到翻译、律师等等,几乎形形色色的行业都有。但这些剧的口碑如何呢?
  先看几部比较热门的:
  以上这些剧在播出时都频频上热搜,但口碑就差强人意了。分数3。55。5不等,连6分及格线都不到。
  相关行业的从业者也吐槽,根本没有反应出行业的真实现状,美其名曰职场剧,其实这不是披着行业外衣的偶像剧嘛!
  进一步汇总国产职场剧的情况可以发现:
  图源:DT财经
  从2008年到2020年3月,共出品64部职场剧,近两年职场题材更有井喷之势,2018年和2019年每年都有13部,数量是2014年的13倍!
  数量上来了,然后质量就堪忧了。从这些职场剧的豆瓣评分可见,平均分一直在5。5分徘徊。
  02:hr披着公关外衣的
  《完美关系》
  那这次瞄准公关行业的《完美关系》能为国产职场剧正名吗?
  《完美关系》是由安建执导,黄轩、佟丽娅领衔主演,陈数、高露主演的都市职场剧。
  故事讲的是公关合伙人卫哲、江达琳等人从单枪匹马到并肩作战,积极迎接在公关实战中遇到的压力与困难,互相影响、共同成长的故事。
  图源:《完美关系》官方剧照
  从2月18日首播以来,《完美关系》的收视率越来越高,3月11日《完美关系》凭借6。92的市场占有率,拿下了收视率排行榜的冠军宝座。
  但同时收获的吐槽和差评也不少,主要集中在:
  剧情太浮夸,对公关行业的刻画不真实;
  女主的傻白甜人设实在不讨喜;
  演员的演技流于表面,难以产生共鸣等等
  03:hr《完美关系》豆瓣3。9分
  到底冤不冤?
  《完美关系》在豆瓣已有60284人进行评分,目前仅为3。9分。那么《完美关系》豆瓣3。9分到底冤不冤呢?
  我们对《完美关系》豆瓣的影评数据进行了收集整理。
  整个数据分析的过程分为三步:
  获取数据
  数据预处理
  数据可视化
  以下是具体的步骤和代码实现:
  获取数据
  1:hr此次我们选择豆瓣短评的数据作为分析对象。由于豆瓣的限制,非登录状态下最多获取200条数据,登录状态下最多获取500条数据。
  为了解决登录的问题,此次我们使用requests的Session方法来让代码自动保存Cookie信息,维持登录和会话保持状态。然后使用Xapth配合正则语句进行数据的提取。
  如图所示,本次我们需要获取的主要内容如下:
  用户名
  用户主页
  评论时间
  评论星级
  短评内容
  短评投票数
  用户主页(用于获取城市)
  评分分布
  代码实现:
  导入所需包
  importpandasaspd
  importrequests
  importparsel
  importre
  importtime
  fromfakeuseragentimportUserAgent
  deflogindouban():
  功能:登录豆瓣,维持会话形式
  globals
  初始化session
  srequests。Session()
  登录地址
  loginurlhttps:accounts。douban。comjmobileloginbasic
  添加headers
  headers{useragent:UserAgent()。random}
  表单数据
  formdata{
  name:你的账号,
  password:你的密码,
  remember:false
  }
  post登录
  try:
  s。post(loginurl,headersheaders,dataformdata)
  except:
  print(登录失败)
  defgetonepage(url):
  功能:给定URL地址,获取豆瓣电影一页的短评信息
  :paramurl:电影URL地址
  :return:返回数据框
  添加headers
  headers{useragent:UserAgent()。random}
  发起请求
  try:
  rs。get(url,headersheaders,timeout5)
  except:
  time。sleep(3)
  rs。get(url,headersheaders,timeout5)
  解析网页
  dataparsel。Selector(r。text)
  获取用户名
  username〔re。findall(r。?(。?)。,i)
  foriindata。xpath(span〔classcommentinfo〕)。extract()〕
  获取评分
  rating〔re。findall(r。?spanclassallstardtitle(。?)。,i)
  foriindata。xpath(span〔classcommentinfo〕)。extract()〕
  获取评论时间
  commenttime〔re。findall(spanclasscommenttimetitle(。)。,i)
  foriindata。xpath(span〔classcommentinfo〕)。extract()〕
  获取短评信息
  commentinfodata。xpath(span〔classshort〕text())。extract()
  投票次数
  votesnumdata。xpath(span〔classcommentvote〕spantext())。extract()
  获取主页URL
  userurldata。xpath(div〔classavatar〕ahref)。extract()
  保存数据
  dfonepd。DataFrame({
  username:username,
  rating:rating,
  commenttime:commenttime,
  commentinfo:commentinfo,
  votesnum:votesnum,
  userurl:userurl
  })
  returndfone
  defgetallpage(movieid,pagenum25):
  功能:获取豆瓣电影25页短评信息
  :parammovieid:电影ID
  :parampagenum:爬取页面数
  :return:返回数据框
  df25pd。DataFrame()
  foriinrange(pagenum):
  构造URL
  urlhttps:movie。douban。comsubject{}comments?start{}limit20statusP。format(movieid,
  i20)
  调用函数
  dfgetonepage(url)
  循环追加
  df25df25。append(df,ignoreindexTrue)
  打印进度
  print(我正在获取第{}页的信息。format(i1))
  休眠一秒
  time。sleep(1)
  returndf25
  ifnamemain:
  先登录豆瓣
  logindouban()
  获取完美关系
  dfallgetallpage(movieid30221758)
  print(dfall。shape)
  获取的数据以数据框的形式存储,结果如下:
  从用户主页的地址可以进一步获取到用户的城市信息,此次共获取500条数据。
  数据预处理
  2:hr对于获取的数据,我们需要进行进一步的处理以满足可视化的需求。
  推荐星级:转换为15分
  评论时间:转换为时间类型,并提取日期数据
  城市信息:有未填写数据、海外城市、写错的需要进行处理
  短评信息:需要进行分词处理
  部分关键代码:
  处理评分列
  df〔rating〕〔re。sub(r〔〕,,i)foriindf〔rating〕〕
  替换空列表
  df〔rating〕。replace(〔〕,还行,inplaceTrue)
  定义字典
  ratingdict{
  很差:1星,
  较差:2星,
  还行:3星,
  推荐:4星,
  力荐:5星
  }
  df〔rating〕df〔rating〕。map(ratingdict)
  评论信息分词处理
  合并为一篇
  txtdf〔commentinfo〕。str。cat(sep。)
  添加关键词
  jieba。addword(黄轩)
  jieba。addword(佟丽娅)
  jieba。addword(男主)
  jieba。addword(女主)
  jieba。addword(跳戏)
  jieba。addword(颜值)
  jieba。addword(吐槽)
  jieba。addword(装逼)
  jieba。addword(国产剧)
  读入停用词表
  stopwords〔〕
  withopen(stopwords。txt,r,encodingutf8)asf:
  linesf。readlines()
  forlineinlines:
  stopwords。append(line。strip())
  添加停用词
  stopwords。extend(〔一部,一拳,一行,10,啊啊啊,一句,
  get,哈哈哈哈,哈哈哈,越来越,一步,
  一种,样子,几个,第一集,一点,
  第一,没见,一集,第一次,两个,
  二代,真的,2020,令人〕)
  评论字段分词处理
  wordnumjieba。analyse。extracttags(txt,
  topK100,
  withWeightTrue,
  allowPOS())
  去停用词
  wordnumselected〔〕
  foriinwordnum:
  ifi〔0〕notinstopwords:
  wordnumselected。append(i)
  keywordspd。DataFrame(wordnumselected,columns〔words,num〕)
  数据可视化
  3:hr我们使用pyecharts进行数据可视化分析,安装命令:pipinstallpyecharts。分析结果如下:
  总体评分分布
  有41。6的人都给了1星,其次28。2的人给了5星。15。4的人给了2星。由此可见本剧的两极分化特别严重,有些人特别喜欢给到了5星好评,同时觉得拍的很烂的也有不少。
  代码实现:
  scorepercdf〔rating〕。valuecounts()df〔rating〕。valuecounts()。sum()
  scorepercnp。round(scoreperc100,2)
  print(scoreperc)
  绘制饼图
  frompyecharts。chartsimportPie
  frompyechartsimportoptionsasopts
  pie1Pie(initoptsopts。InitOpts(width1350px,height750px))
  pie1。add(,
  〔zip(scoreperc。index,scoreperc。values)〕,
  radius〔35,70〕)
  pie1。setglobalopts(titleoptsopts。TitleOpts(title总体评分分布),
  legendoptsopts。LegendOpts(orientvertical,postop15,posleft2),
  toolboxoptsopts。ToolboxOpts())
  pie1。setseriesopts(labeloptsopts。LabelOpts(formatter{c}))
  pie1。setcolors(〔D7655A,FFAF34,3B7BA9,EF9050,6FB27C〕)
  pie1。render()
  评分热度时间走势
  评分热度主要集中在2月18日,也就是《完美关系》首播的那天,其次热度不断下降。
  代码实现:
  df〔commenttime〕pd。todatetime(df〔commenttime〕)
  df〔commentdate〕df〔commenttime〕。dt。date
  commentnumdf〔commentdate〕。valuecounts()。sortindex()
  折线图
  frompyecharts。chartsimportLine
  line1Line(initoptsopts。InitOpts(width1350px,height750px))
  line1。addxaxis(commentnum。index。tolist())
  line1。addyaxis(评论热度,commentnum。values。tolist(),
  areastyleoptsopts。AreaStyleOpts(opacity0。5),
  labeloptsopts。LabelOpts(isshowFalse))
  line1。setglobalopts(titleoptsopts。TitleOpts(title时间走势图),
  toolboxoptsopts。ToolboxOpts(),
  visualmapoptsopts。VisualMapOpts(max200))
  line1。render()
  评论用户城市分布
  观看和评分人群主要集中在北上广三地,其次是江苏、四川等地。
  代码实现:
  国内城市top10
  citytop10df〔citydealed〕。valuecounts()〔:12〕
  citytop10。drop(国外,inplaceTrue)
  citytop10。drop(未填写,inplaceTrue)
  条形图
  frompyecharts。chartsimportBar
  bar1Bar(initoptsopts。InitOpts(width1350px,height750px))
  bar1。addxaxis(citytop10。index。tolist())
  bar1。addyaxis(城市,citytop10。values。tolist())
  bar1。setglobalopts(titleoptsopts。TitleOpts(title评论者Top10城市分布),
  visualmapoptsopts。VisualMapOpts(max50),
  toolboxoptsopts。ToolboxOpts())
  bar1。render()
  citynumdf〔citydealed〕。valuecounts()
  citynum。drop(国外,inplaceTrue)
  citynum。drop(未填写,inplaceTrue)
  frompyecharts。chartsimportMap
  地图
  map1Map(initoptsopts。InitOpts(width1350px,height750px))
  map1。add(,〔list(z)forzinzip(citynum。index。tolist(),citynum。values。tolist())〕,
  maptypechina)
  map1。setglobalopts(titleoptsopts。TitleOpts(title评论者国内城市分布),
  visualmapoptsopts。VisualMapOpts(max50),
  toolboxoptsopts。ToolboxOpts())
  map1。render()
  评论词云
  而在词云方面讨论最多的就是黄轩和佟丽娅两大主演了。
  其次关于女配陈数的讨论也很多,无论是陈数这次强大的职场新女性人设,还是惊艳干练的职场穿搭都是很吸睛的。
  然后对演技和剧情上的吐槽也不少。评价中油腻、尴尬、狗血等负面词频频出现。
  代码实现:
  词云图
  frompyecharts。chartsimportWordCloud
  frompyecharts。globalsimportSymbolType
  word1WordCloud(initoptsopts。InitOpts(width1350px,height750px))
  word1。add(,〔zip(keywords。words,keywords。num)〕,
  wordsizerange〔20,200〕,
  shapeSymbolType。DIAMOND)
  word1。setglobalopts(titleoptsopts。TitleOpts(完美关系豆瓣短评词云图),
  toolboxoptsopts。ToolboxOpts())
  word1。render()
  那么《完美关系》你怎么看呢?
  作者:Mika
投诉 评论 转载

口碑扑街告诉你完美关系为何表CDA数据分析师出品【导语】:今天我们聊聊国产职场剧《完美关系》,Python技术部分可以直接看第三部分。Showmedata,用数据说话今天我们聊聊职场剧《……大果水晶梨注意防治黑斑病大果水晶梨如管理不善,易感染黑斑病,常常引起早期落叶,使树势衰弱,继而影响果实品质,给果农造成很大损失。现给大家介绍黑斑病的危害症状、发病规律及防治方法。危害症状该病主要……从冰桶挑战学到的个营销经验ALS(肌萎缩侧索硬化症)冰桶挑战证明了社交媒体在全美范围内影响公益营销的能力。这项挑活动让社交媒体、名人与草根慈善事业都参与其中,在炎炎夏日带来一股如飓风般强劲传播开来的社会……何人适合在家中养龟在中国古代传说,麒麟、凤凰、龙和龟这四灵是瑞兽,都是吉祥,仁寿的象征,但是前三灵全是虚构的图腾,并不存在于真实环境里,而且只能为帝皇权贵所用,普通老百姓对它们只能敬而远之。然而……小心爱情让这些生肖变得不可理喻生肖牛:没有原则的执着生肖牛个性比较固执,认死理,尤其是在对待婚恋问题方面,认定对方后便会极为认真,对爱过于执着。遇到不合适的对象或者渣男渣女时,倾向于一直忍耐对方,即使……衣服上有杨梅汁用什么才能洗掉我们都知道,杨梅是生活中比较常见的一种水果,它的味道香甜可口,吃起来水嫩多汁,深受人们喜欢,很多人吃杨梅的时候,都会不小心将杨梅汁弄到衣服上了。那么衣服上有杨梅汁用什么才能洗掉……想见你彩蛋在哪看想见你新结局彩蛋在线观看地址台剧想见你新加全新结局了!是剧组在大结局资源被泄露的隔天新拍的,据说是一个15分钟的小彩蛋,真的很令人期待了!不得不说,想见你的剧组太暖心了!随着明晚的大结局,我们也将迎来想见……别过度强调学习家长如何让考生过好考前复习目前,进入了冲刺时刻,家长学校过高的期望让考生尚显稚嫩的双肩承荷了太多的压力,也让家长身心俱疲。如何让考生过好考前复习阶段,家长要注意以下问题:第一、摆正心态。家长是高考……董事会的战略职责董事作为为公司指引方向的人,战略决策应该是公司董事会的首要职责。但是在现实运作中,很多公司的董事会却没有在公司战略决策中发挥多大的作用。一些看上去似乎已经发挥了战略决策作……广东南华工商职业学院清远校区宿舍攻略南华工商学院现有天河、黄埔、aclasstaghrefwiki10076IQLPkzg。html清远a三个校区。清远新校区坐落在清远市清城区教育文化园内,校园占地995亩,校区……怎样制作手工推拉盒aclasstaghrefwiki10790IF35ZKy80。html大家a想知道怎样用纸做出小巧可爱的推拉盒吗?以前用的火柴就是用的推拉盒哦,它现在也有很多用处。下面小编就……刺激战场刺激周报在哪里看aclasstaghrefwiki10440IFHX4da20。html刺激a战场刺激周报在哪里看?下面就这个话题跟大家一起来说一下吧。操作方法01:hr首先你要做……
网吧的地线应该怎么接专家教你预防老年人失眠的妙招急性中耳炎的症状及危害如何知道宝宝缺维生素充气攀岩的优点有哪些脾气好的人为什么会更长寿贷款工作证明怎么写缓解孕期妊娠纹要注意什么薏米仁食疗养生的功效和作用吸盘挂钩吸不住怎么办简单几招教你把吸盘挂钩吸住缩阴紧致用哪款药最好千万女人想变紧注定孤独一生
怎么选择口红的颜色适合自己EIE是能源区块链的新一代运营体系人最痛快的活法,是主动出击黑米药剂浸种五注意小学三年级作文安全与生命同行谁说红唇妆太艳俗?只要找准适合自己的风格,就能个性又美艳绿维文旅旅游房地产开发攻略岁前有性生活小心这种癌症如果您删除Windows11上的ProgramFiles文件四大消息影响今天大盘08年的日记327乌克兰战争爆发后,中俄关系成中美关系当中重要因素

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找菏泽德阳山西湖州宝鸡上海茂名内江三亚信阳长春北海西安安徽黄石烟台沧州湛江肇庆鹤壁六安韶关成都钦州