昨天看到一个电影网站的推荐帖子,突然想到可以把这个网站的所有种子下载到本地电脑上,于是就用Python写了一个爬虫。进行得很顺利,手段也很简单暴力。
先上效果图
截至发帖时,已抓取并仍在抓取超过1,500 个torrent 文件。
简单介绍一下原理
该网站不进行IP或UA检查,因此很容易下线。
一般流程是:
1、定期提取当前页面的所有标题和链接。
2.输入链接即可下载。请参考下图
3。单击此链接将生成ajax 请求并在页面上显示弹出层。其中的下载地址就是实际的种子地址。
4。种子的原始标题是不规则字符,类似于MD5。如果您以标题作为文件名保存种子,请小心删除无效字符,例如斜杠(实际上只是斜杠)。
以下是完整脚本
本爬虫使用request库,请随意使用。
如果你对Python和爬虫技术感兴趣,关注我并私信回复[bt]即可获取此脚本。
如果想要更多Python学习资料,关注我并私信回复【Python】即可领取5G爬虫学习视频资料。
版权声明:本文由今日头条转载,如有侵犯您的版权,请联系本站编辑删除。