更新时间:2023-03-10 来源:黑马程序员 浏览量:
Python自带的urllib和urllib2,也可以使用requests这种第三方库,或者Scrapy框架。
urllib和urllib2模块都可以做与请求URL相关的操作,但它们提供了不同的功能。
urllib2.urlopen可以接收一个Request对象或者URL(在接受Request对象的时候,并以此可以来设置一个URL的headers),urllib.urlopen只接收一个URL。
由于urllib有urlencode方法可以将字符串以URL进行编码,但是urllib2没有,urllib和urllib2经常会一起使用。urllib2可以接收一个Request类的实例来设置URL请求的headers,urlib仅可以接受URL。
request是一个HTTP库,它可以用来对HTTP进行请求,是一个强大的库,但是下载和解析部分需要自己处理,灵活性高,高并发与分布式部署也非常灵活,对于功能可以更好实现。
Scrapy是一个封装起来的框架,它包含了下载器、解析器、日志及异常处理,基于多线程,Scrapy基于多线程和Twisted的方式处理,对于固定单个网站的爬取开发有优势,但是对于多网站爬取,在并发及分布式处理方面,显得不够灵活。
【AI设计】北京143期毕业仅36天,全员拿下高薪offer!黑马AI设计连续6期100%高薪就业
2025-09-19【跨境电商运营】深圳跨境电商运营毕业22个工作日,就业率91%+,最高薪资达13500元
2025-09-19【AI运维】郑州运维1期就业班,毕业14个工作日,班级93%同学已拿到Offer, 一线均薪资 1W+
2025-09-19【AI鸿蒙开发】上海校区AI鸿蒙开发4期5期,距离毕业21天,就业率91%,平均薪资14046元
2025-09-19【AI大模型开发-Python】毕业33个工作日,就业率已达到94.55%,班均薪资20763元
2025-09-19【AI智能应用开发-Java】毕业5个工作日就业率98.18%,最高薪资 17.5k*13薪,全班平均薪资9244元
2025-09-19