• 欢迎访问db1024网站,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站
  • 如果您觉得本站非常有看点,那么赶紧使用Ctrl+D 收藏db1024吧

使用Tumblr爬虫,结合h5ai创建图库

主机教程 Liam 1年前 (2019-04-28) 306次浏览 0个评论 扫描二维码
文章目录[隐藏]

Tumblr内容丰富,特别是图片和视频。下面利用Tumblr爬虫,结合h5ai目录直读程序,或者其他图床程序,创建图库。

本方法需要一个Python 2.7的环境,CentOS 6升级Python 2.7方法请参考CentOS 6升级Python 2.6至Python 2.7的方法,CentOS 7自带python 2.7,下面使用CentOS 7和python 2.7

使用tumblr-crawler爬虫

tumblr-crawler爬虫github项目地址:https://github.com/dixudx/tumblr-crawler

1、安装可能使用的依赖

yum install openssl-devel bzip2-devel expat-devel gdbm-devel readline-devel sqlite-devel yum -y install gcc automake autoconf libtool make yum install gcc gcc-c++ yum -y install readline-devel 

2、安装tumblr-crawler

git clone https://github.com/dixudx/tumblr-crawler.git cd tumblr-crawler pip install -r requirements.txt 

3、使用tumblr-crawler下载图片和视频
1、在sites.txt中添加tumblr站,用逗号分开,但不需要.tumblr.com后缀。如rat.tumblr.comrats.tumblr.com

rat,rats 

保存后,运行

python tumblr-photo-video-ripper.py 

2、直接下载

python tumblr-photo-video-ripper.py rat,rats

最后将所有图片和视频均保存在当前路径的与tumblr博客名字相同的文件夹

安装、使用h5ai

具体安装方法参考:一款不错的PHP目录列表程序:h5ai安装教程


db1024 , 版权所有丨如未注明 , 均为原创丨本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:使用Tumblr爬虫,结合h5ai创建图库
喜欢 (0)
关于作者:
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址