常用网站开发模式,网站备案期间能使用吗,如何制作一个手机网站源码,哈尔滨小程序制作公司使用python做最简单的爬虫 --之心 #第一种方法import urllib2 #将urllib2库引用进来responseurllib2.urlopen(http://www.baidu.com) #调用库中的方法#xff0c;将请求回应封装到response对象中htmlresponse.read() #调用response对象的read#xff08;#x…使用python做最简单的爬虫 --之心 #第一种方法import urllib2 #将urllib2库引用进来responseurllib2.urlopen(http://www.baidu.com) #调用库中的方法将请求回应封装到response对象中htmlresponse.read() #调用response对象的read方法将回应字符串赋给hhtml变量print html #打印出来#第二中方法import urllib2requrllib2.Request(http://ww.baidu.com)responseurllib2.urlopen(req)html response.read()print html一般情况下上面的爬虫如果大量爬行会被限制访问所以要伪装成浏览器进行访问 这里用伪装成IE9.0进行访问#要求请的url地址import urllib2urlhttp://www.baidu.com#要伪装的浏览器user_agent头user_agentMozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/39.0.2171.71 Safari/537.36;#创建字典使请求的headers中的’User-Agent‘对应user_agent字符串headers{User-Agent:user_agent}#新建一个请求将请求中的headers变换成自己定义的req urllib2.Request(url,headersheaders)#请求服务器得到回应responseurllib2.urlopen(req)#得到回应内容the_pageresponse.read()#打印结果print the_page转载于:https://www.cnblogs.com/DaoXin-WXR/p/8012968.html