Ⅰ 大全!Python爬取芒果TV、腾讯视频、B站、爱奇艺、知乎、微博弹幕!
大家好~ 我是菜鸟哥!今天讲解如何用python爬取芒果TV、腾讯视频、B站、爱奇艺、知乎、微博等平台的弹幕和评论,这类爬虫结果用于娱乐、舆情分析。
本文提供六个平台的十个爬虫案例,感兴趣的朋友可按平台顺序查看。完整源码已提供。
以芒果TV为例,以电影《悬崖之上》为例,讲解如何爬取弹幕和评论。芒果TV的弹幕数据通过开发者工具抓包获得,视频每播放一分钟更新一次数据包。评论数据在网页底部,通过抓包分析得到。
腾讯视频以电影《革命者》为例,弹幕数据同样通过开发者工具抓包获得,视频每播放30秒更新一次数据包。评论数据在网页底部,通过抓包分析得到。
B站以视频《“这是我见过最拽的一届中国队奥运冠军”》为例,弹幕数据通过点击弹幕列表行展开,查看历史弹幕获得。评论数据在网页下方,通过抓包分析得到。
爱奇艺以电影《哥斯拉大战金刚》为例,弹幕数据通过开发者工具抓包获得,视频每60秒更新一次数据包。评论数据在网页下方,通过抓包分析得到。
知乎以热点话题《如何看待网传腾讯实习生向腾讯高层提出建议颁布拒绝陪酒相关条令?》为例,爬取回答内容。知乎的回答内容为动态加载,通过抓包分析得到。
微博以热搜《霍尊手写道歉信》为例,爬取评论内容。微博评论为动态加载,通过抓包分析得到。
以上便是今天的全部内容,完整源码已提供。如果你喜欢今天的内容,希望你能在下方点个赞和在看支持我,谢谢!
Python资料免费领取