词条信息

admin
admin
超级管理员
词条创建者 发短消息   

相关词条

热门词条

更多>>
什么是端口?到底是做什么的呢?
端口一般指两种,一种是硬件比如路由器或者交换机的插网线的端口,一种是软件的逻辑的概念,比如http的80端口!...
7种进阶方法让你快速测试端口连通性
Ping是Windows、Linux和Unix系统下的一个检查网络连通性的命令工具,对于大部分互联网用户来说很...
电脑开机,总需要按F1,是什么原因造成的?
一.主板掉电这个说法是行业内的叫法了,一般是主板的CMOS电池没电了导致的。也是最常见的一种提示你按F1的提示...
社保降费对个人有什么影响?
下调城镇职工基本养老保险单位缴费比例是政府给企业发的一个大红包,特别是对于企业来说是一个利好,但是对个人来说有...
车辆“出险”对下年保费的影响,到底有多大?
【出险对交强险的影响】【出险对商业险的影响】车辆“出险”对下年保费的影响,到底有多大?这里有必要先提下车险第三...

精选图集

更多>>
简易百科旧版 >>所属分类 >> 程序开发    Python   

Python爬取妹子图片源码

标签: Python 妹子 图片

顶[0] 发表评论(0) 编辑词条
#-*-coding:utf-8
import requests
import lxml
import os
from bs4 import BeautifulSoup
class MEZI():
    def __init__(self,url,pageIndex):
        self.url=url+str(pageIndex)
        self.headers = {'User-Agent':'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)'}
 
    #得到一页的网页源码
    def get_one_page_html(self):
        re=requests.get(self.url,headers=self.headers)
        html=re.text
        return html
 
        #得到一个妹子的写真集的url
    def get_one_person_url(self):
        all_a=[]
        html=self.get_one_page_html()
        soup=BeautifulSoup(html,'lxml')
        all_p=soup.find('p',class_='postlist')
        all_span=all_p.find('ul').find_all('span')
        for span in all_span:
            if span.find('a'):
                all_a.append(span.find('a').get('href'))
        return all_a
 
    def download(self,filename):   #filename是你要存储的路径名
        x=1
        all_a=self.get_one_person_url()
        for a in all_a:   #这里只是一张照片的地址
            for i in range(1,30):    #限制每个人下载30张照片
                url=a+'/'+str(i)
                re=requests.get(url ,headers=self.headers)
                print u'正在下载图片:%s'%re.url
                html=re.text
                soup=BeautifulSoup(html,'lxml')
                img_url=soup.find('img').get('src')
                html_img = requests.get(img_url, headers=self.headers)
                img_name=str(x)+'.jpg'
                path=os.path.normpath(os.path.join(filename,img_name))    #这里是规范你的绝对路径,os.path.join(filename,img_name)是将目录名和文件名连接在一起
                with open(path,'wb') as f:   #开始下载
                    f.write(html_img.content)
                x=x+1
 
 
 
 
if __name__=="__main__":
    url='https://www.mzitu.com/page/'
    for i in range(1,30):
        app = MEZI(url, i)
        filename = 'g:\\picture2'
        app.download(filename)

 

 

附件列表


按字母顺序浏览:A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

→我们致力于为广大网民解决所遇到的各种电脑技术问题
 如果您认为本词条还有待完善,请 编辑词条

上一篇用node写个爬虫?
下一篇90个恶意App被曝光并下架

0
1. 本站部分内容来自互联网,如有任何版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
2. 本站内容仅供参考,如果您需要解决具体问题,建议您咨询相关领域专业人士。
3. 如果您没有找到需要的百科词条,您可以到百科问答提问或创建词条,等待高手解答。

关于本词条的提问

查看全部/我要提问>>