使用bilibili评论api爬取多个视频评论,能更快更全面的爬取数据,比Selenium爬取更快,避免浏览器崩溃的问题,不需要安装额外的驱动。

功能:

  1. 能够爬取到多个视频评论:将需要爬取的视频名字和对应的BV号填入 video_list.csv 即可,BV号可以从视频的网址中截取(例如BV1Pj411S7LW)

  2. 能够全面爬取评论和用户数据:能够爬取到一级评论和对应的二级评论,及评论相关数据(用户昵称、用户当前等级、用户性别、评论内容、被回复用户昵称、评论层级、评论点赞数量和回复时间)

  3. 保存的文件都在result目录下,并以视频名称命名。

安装:

​ requests是 一个用于发送HTTP请求的库,非Python标准库,需要额外安装。 安装方法:打开终端或命令提示符,输入以下命令:

pip install requests

爬取结果示例:

​ 输出结果是UTF-8格式,如果打开是乱码请更换打开方式(pycharm,记事本等)或者检查编码格式。

声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。