手机版 欢迎访问人人都是自媒体网站
本文作者将以《大秦帝国之崛起》作为分析对象,来详细阐述在大数据时代数据分析会涉及到的全网舆情分析、微博传播分析以及文本挖掘。
今年开年,因饰演白起的演员王学兵吸毒而拖延上映的《大秦帝国之崛起》(以下简称为“崛起”),终于在剧迷的千呼万唤中播出。
这部根据孙皓晖同名小说改编的电视剧是“大秦帝国”系列的第三部,首部《大秦帝国之裂变》,第二部《大秦帝国之纵横》分别于2009年、2013年播出,均获得不错的口碑,第三部《大秦帝国之崛起》因为上面的原因而补拍,直到今年年初才在央视开播。
本文将以该剧作为分析对象,来详细阐述在大数据时代数据分析会涉及到的三个“子课题”:
全网的舆情分析:基于全网媒体或网民关于该剧的探讨,进行“Social Listening(社会化聆听)”,了解该剧整体口碑概况
微博传播分析:基于新浪微博某条对于该剧具有重大影响力的微博的传播情况,了解该条微博的传播规律,互动粉丝的画像,以及水军的辨识
文本挖掘:通过对该剧相关非结构化文本数据的分析,了解其获得观众较高认可的原因
在接下来的分析中,笔者将结合分析工具(新浪微舆情、头条媒体实验室、Python、Gephi等)、分析思路(分析角度和分析流程)、业务知识(对该剧的了解和原著小说的认知),来谈谈一个完整的数据分析case如何完成,上面所涉及的3个子课题是本文分析的重点。下图是本文的主要内容和文章结构:
(1)“崛起”的全网关注度走势
因为该剧播出的时间段是2017-2-9~2017-3-6,故笔者选取了在该剧播出前后略有延展的时间区间,以便观察这段时间内关于该剧的全网信息量走势。
大秦帝国之崛起全网关注度走势图(2-1~3-13)
从全网总体的关注度来看,在电视剧播出前的关注量较少,而在电视剧播出期间的关注度(有关该剧的网络信息量)陡然上升,在播出的第一天(2017-2-9)关注度就出现了明显在上升。在该剧在播出结束后(2017-3-6),信息量逐渐减少,呈下降趋势。
(2)“崛起”的全网关注度来源
从各信息发布渠道的表现来看,该剧在微博(新浪微博和腾讯微博)上的信息量占据主导地位,“二次崛起”后的微博仍是娱乐影视的主阵地,是粉丝与主创团队进行互动的首选。下图是“崛起”的全网信息量来源构成。
除去微博的信息之后,则可以看到除微博(新浪微博和腾讯微博)以外哪些信息渠道关于该剧的讨论量较多。
由此可以看出,新浪博客、百度贴吧这样的泛娱乐化社区关于该剧的讨论也颇多,前者滥觞于明星入驻,是全国最主流,人气颇高的博客频道之一;而百度贴吧是全球最大的中文社区,是“粉丝文化”的催化剂。百度贴吧的迅速走红,是与“粉丝”及“粉丝文化”的流行紧密相关的,而在“粉丝文化”的发展过程中,百度贴吧也起到了重要作用。
1.2 全网关于“崛起”的关注点(1)“崛起”的全网信息形成的关键词云
以下是全网关于“崛起”的文本信息的关键词提取,总计有60个,这些关键词来自于媒体报道,抑或用户UGC评论,从中我们可以发现网路上关于该剧的讨论集中在哪些关键点上。
从上图中可以看出,除了本剧的片名—“大秦帝国”以外,还有一些比较反映该剧特征的词汇,根据笔者对该剧的了解,特挑出其中主要的两类词汇:
剧集相关:“收视”和“收视率”(在无大规模宣传的情况下,收视率一路走高)、“拍戏”、“张博”(饰演秦昭襄王嬴稷的演员)、“导演”、“剧本”、“创作”、“花絮”、“创作者”
Copyright © 2018 DEDE97. 织梦97 版权所有 京ICP