B站视频弹幕数据+可视化分析。
这里以前段时间很火的一部动漫鬼灭之刃为例,剧场版截至目前已超350亿票房。
数据怎么来
要想做数据分析,首先要有数据来源,通过Python实现弹幕爬虫就能简单得到动漫视频数据。
动漫视频分为好多集,对每一集弹幕信息做爬取,需要我们知道每一集的ID信息。
如下图所示,这是第一集的视频ID。
没开会员的同学就只能看到一集的数据了。没关系,我已经爬取下来了。数据往下看。
由于篇幅原因,这里放部分爬虫代码。
运行完爬虫代码,即可得到一系列.csv文件。
不运行上面爬虫代码获取没关系,我已经替大家爬取下来了,大家可以直接用来做数据可视化。
这里主要用到csv(用来解析.csv文件),pyecharts(可视化输出),pandas(数据处理)模块包。
这里直接展示效果图。
柱图
饼图
折线图
云图
等等,这里就不一一列出了。。更多及源码请公众号回复 "弹幕"。
原文:https://mp.weixin.qq.com/s?__biz=Mzg3OTExODI3OA==&mid=2247484006&idx=1&sn=1f11ec4701ce033726f116535909fa84&chksm=cf0810cff87f99d9921ee40ab38c15308a54b1404f2847102a6b2a92e9a72cfabd2e8fd4b770&token=483631163&lang=zh_CN#rd