抖音直播爬虫 python 实现

注意:不能获取匿名直播间用户信息,这只是爬虫,不是黑客。
抖音弹幕抓取,礼物抓取,直播流地址抓取,可以抓取到m3u8直播流链接,还有flv直播流链接,还有直播礼物打赏排名,在线观众排名等等。
可配置服务端地址,将数据推送到自己的服务器,可以控制是否开启推送等配置。可以控制是否保存lOG文件等配置。

环境大于3.6应该都可以

python 3.9 

安装依赖

pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple/

生成Proto文件

(proto是需要单独安装的一个工具哦,mac电脑应该是必须执行这条命令才可以,windows的应该可以直接用)

protoc -I . --python_out=. ./proto/dy.proto

此时会在proto文件夹中重新生成dy_pb2.py文件,mac电脑一定要这样做,windows也尽量这样生成一下,避免程序启动失败。

动态配置

# 配置日志信息
import logging

# 配置日志信息
LOG_FILE_SAVE = True
LOG_FILE_NAME = "log.txt"
LOG_LEVEL = logging.DEBUG
LOG_FORMAT = "%(asctime)s - %(levelname)s - %(message)s"

# 直播信息配置:直播地址,直播用户排名,直播排名抓取间隔,直播推送到后台,推送到后台地址
LIVE_ROOM_URL = "https://live.douyin.com/646454278948"
# 特殊礼物单独统计
LIVE_GIFT_LIST = ["月下瀑布"]
# 是否抓取在线打赏排名
LIVE_RANK_LIST = True
# 获取礼物排名时间间隔: 建议不要低于10秒
LIVE_RANK_INTERVAL = 10
# 使用ws推送直播数据
LIVE_WEB_SEND = False
# 是否开启HTTP推送
LIVE_HTTP_SEND = True
# 多久向服务端推送一条消息
LIVE_SEND_INTERVAL = 3
# HTTP推送地址:普通用户不用管下面的配置,需要将直播数据推送到你们服务器的才配置
LIVE_WEB_SEND_URL = "http://************/game/gamemgnt"
# 一场比赛唯一的UUID
GAME_UUID = "157ae45b-263b-414a-8976-6d2ad210a7e8"
# 应援UUID(这是我们自己项目推送使用的参数):4
DONATION_UUID = "179019d3-83dd-4619-b7d9-579786659204"

运行

打开浏览器,打开你想监听的抖音直播间,然后将直播间网址黏贴到config.py的LIVE_ROOM_URL中,然后运行main.py程序即可看到效果。 注意:如果要获取排名,需要将时间间隔设置大一点,否则抓取频繁会获取不到数据:打包房间人数失败

python main.py
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。