下面小编为大家带来Python使用Scrapy爬取妹子图,本文共3篇,希望能帮助大家!本文原稿由网友“new371433”提供。
篇1:Python使用Scrapy爬取妹子图
前面我们给大家介绍了使用nodejs来爬取妹纸图片的方法,下面我们来看下使用Python是如何实现的呢,有需要的小伙伴参考下吧,
Python Scrapy爬虫,听说妹子图挺火,我整站爬取了,上周一共搞了大概8000多张图片。和大家分享一下。
核心爬虫代码
# -*- coding: utf-8 -*-from scrapy.selector import Selectorimport scrapyfrom scrapy.contrib.loader import ItemLoader, Identityfrom fun.items import MeizituItem class MeizituSpider(scrapy.Spider): name = “meizitu” allowed_domains = [“meizitu.com”] start_urls = ( ‘www.meizitu.com/‘, ) def parse(self, response): sel = Selector(response) for link in sel.xpath(‘//h2/a/@href‘).extract:request = scrapy.Request(link, callback=self.parse_item)yield request pages = sel.xpath(“//div[@class=‘navigation‘]/div[@id=‘wp_page_numbers‘]/ul/li/a/@href”).extract() print(‘pages: %s‘ % pages) if len(pages) >2:page_link = pages[-2]page_link = page_link.replace(‘/a/‘, ‘‘) request = scrapy.Request(‘www.meizitu.com/a/%s‘ % page_link, callback=self.parse)yield request def parse_item(self, response): l = ItemLoader(item=MeizituItem(), response=response) l.add_xpath(‘name‘, ‘//h2/a/text()‘) l.add_xpath(‘tags‘, “//div[@id=‘maincontent‘]/div[@class=‘postmeta. clearfix‘]/div[@class=‘metaRight‘]/p”) l.add_xpath(‘image_urls‘, “//div[@id=‘picture‘]/p/img/@src”, Identity()) l.add_value(‘url‘, response.url) return l.load_item()
项目地址:github.com/ZhangBohan/fun_crawler
以上所述就是本文的全部内容了,希望大家能够喜欢,
篇2:python爬取网站数据保存使用的方法
-12-12Python抓取Discuz!用户名脚本代码
-01-01使用cx_freeze把python打包exe示例
-12-12pymssql ntext字段调用问题解决方法
2014-06-06python实现的udp协议Server和Client代码实例
2013-02-02python创建只读属性对象的方法(ReadOnlyObject)
2014-06-06python网络编程学习笔记(三):socket网络服务器
2014-04-04python多线程抓取天涯帖子内容示例
-12-12python 多线程应用介绍
2013-02-02python中的一些类型转换函数小结
2014-01-01Python群发邮件实例代码
篇3:python爬取网站数据保存使用的方法
最近更 新
python3.3实现乘法表示例
可用于监控 mysql Master Slave 状态的py
python 图片验证码代码
linux下安装easy_install的方法
python基础教程之元组操作使用详解
Python的ORM框架SQLAlchemy入门教程
Python 调用VC++的动态链接库(DLL)
python 算法 排序实现快速排序
Python Trie树实现字典排序
Python程序设计入门(3)数组的使用
热 点 排 行
Python入门教程 超详细1小时学会
python 中文乱码问题深入分析
比较详细Python正则表达式操作指
Python字符串的encode与decode研
Python open读写文件实现脚本
Python enumerate遍历数组示例应
Python 深入理解yield
Python+Django在windows下的开发
python 文件和路径操作函数小结
python 字符串split的用法分享
Python中使用tarfile压缩、解压tar归档文件示例
- 快速学会使用思维导图的6个方法2025-02-22