当前位置: 首页 > news >正文

什么专业会制作网站罗湖做网站的公司哪家好

什么专业会制作网站,罗湖做网站的公司哪家好,廊坊首位关键词优化电话,卖挂的网站怎么做*之前偶然看了某个腾讯公开课的视频,写的爬取赶集网的租房信息,这几天突然想起来,于是自己分析了一下赶集网的信息,然后自己写了一遍,写完又用用Python3重写了一遍.之中也遇见了少许的坑.记一下.算是一个总结.*python2 爬取赶集网租房信息与网站分析 分析目标网站url寻找目标标… *之前偶然看了某个腾讯公开课的视频,写的爬取赶集网的租房信息,这几天突然想起来,于是自己分析了一下赶集网的信息,然后自己写了一遍,写完又用用Python3重写了一遍.之中也遇见了少许的坑.记一下.算是一个总结.*python2 爬取赶集网租房信息与网站分析 分析目标网站url寻找目标标签获取,并写入csv文件#-*- coding: utf-8 -*- from bs4 import BeautifulSoup from urlparse import urljoin import requests import csvURL http://jn.ganji.com/fang1/o{page}p{price}/ # 首先最基本的是 jn,ganji.com/fang1 其中jn为济南,也就是我的城市,默认登录后为此 # 而fang1 位租房信息 fang5 为二手房信息,zhaopin 为招聘模块等,我们这次只查找fang1 # 不过这个链接还可以更复杂 #比如http://jn.ganji.com/fang1/tianqiao/h1o1p1/ 或者 # http://jn.ganji.com/fang1/tianqiao/b1000e1577/ # 其中h:房型,o页面,p价格区间,其中h,p后的数字与网站相应菜单的排列顺序相对应 # 而s与e则为对应的自己输入的价格区间 # h: house o:page p:price # jn jinan fang1 zufang tiaoqiao:tianqiaoqu b:begin 1000 e:end start 1755ADDR http://bj.ganji.com/ start_page 1 end_page 5 price 1# 注意wb格式打开写入可能会导致csv文件每次写入前面多一个空格 # 对此你可以参考这篇文章:http://blog.csdn.net/pfm685757/article/details/47806469 with open(info.csv,wb) as f :csv_writer csv.writer(f,delimiter,)print startingwhile start_pageend_page:start_page1# 通过分析标签可知我们要获取的标签信息必须要通过多个class确认才能保证唯一性# 之后是获取信息的具体设置print get{0}.format(URL.format(page start_page,priceprice))response requests.get(URL.format(page start_page,priceprice))htmlBeautifulSoup(response.text,html.parser)house_list html.select(.f-list .f-list-item .f-list-item-wrap)#check house_listif not house_list:print No house_listbreakfor house in house_list:house_title house.select(.title a)[0].string.encode(utf-8)house_addr house.select(.address .area a)[-1].string.encode(utf-8)house_price house.select(.info .price .num)[0].string.encode(utf-8)house_url urljoin(ADDR,house.select(.title a )[0][href])# 写入csv文件csv_writer.writerow([house_title,house_addr,house_price,house_url])print ending Python3 爬取赶集网i租房信息 要注意的点 urlparse.urljoin 改为urllib.urlparse.urljoin# python2 from urlparse import urljoin # Python3 from urllib.parse import urljoin Python3中csv对bytes和str两种类型进行了严格区分,open的写入格式应该进行改变wb-w设置utf8编码格式with open(info.csv,w,encodingutf8) as f :csv_writer csv.writer(f,delimiter,) 完整代码如下 #-*- coding: utf-8 -*- from bs4 import BeautifulSoup from urllib.parse import urljoin import requests import csvURL http://jn.ganji.com/fang1/o{page}p{price}/ # h: house o:page p:price # http://jn.ganji.com/fang1/tianqiao/b1000e1577/ # jn jinan fang1 zufang tiaoqiao:tianqiaoqu b:begin 1000 e:end start 1755 # fang5 为二手房 zhipin 为 招聘 赶集网的url划分的都很简单,时间充足完全可以获取非常多的信息ADDR http://bj.ganji.com/ start_page 1 end_page 5price 1 URL http://jn.ganji.com/fang1/h{huxing}o{page}b{beginPrice}e{endPrice}/ # 选择户型为h1-h5 # 输入价位为 begin or end priceb1000e2000# 户型为 # 默认为utf8打开,否则会以默认编码GBK写入 with open(info.csv,w,encodingutf8) as f :csv_writer csv.writer(f,delimiter,)print(starting)while start_pageend_page:start_page1print(get{0}.format(URL.format(page start_page,priceprice)))response requests.get(URL.format(page start_page,priceprice))htmlBeautifulSoup(response.text,html.parser)house_list html.select(.f-list .f-list-item .f-list-item-wrap)#check house_listif not house_list:print(No house_list)breakfor house in house_list:house_title house.select(.title a)[0].stringhouse_addr house.select(.address .area a)[-1].stringhouse_price house.select(.info .price .num)[0].stringhouse_url urljoin(ADDR, house.select(.title a )[0][href])csv_writer.writerow([house_title,house_addr,house_price,house_url])print(ending) 最后的csv文件展示一下: 转载于:https://www.cnblogs.com/fonttian/p/9162844.html
http://www.zqtcl.cn/news/369185/

相关文章:

  • 永久免费ppt下载网站有没有跟一起做网店一样的网站
  • 百川网站石家庄物流网站建设
  • 广州外贸网站设计外贸seo外贸推广外贸网站建设外贸网站建设
  • 网站 栏目建设银行网站用户名是什么
  • 服装类的网站建设中原免费网站建设
  • 网站开发培训班多少报名费安徽省建设工程信息网站
  • 旅游网站规划设计余姚网站公司
  • 广州市地铁站地图dede增加手机网站
  • dede 网站名称 空的网站开发行业新闻
  • 网站开发费用做账升级系统
  • 外贸公司网站制作价格网络公司的经营范围有哪些
  • 东莞三合一网站制作海南省生态文明村建设促进会网站
  • 邯郸做企业网站设计的公司福田祥菱m2
  • 手表拍卖网站动漫做暧视频网站
  • 福州网站定制公司如何做p2p网站
  • 微信外链网站开发嘉兴市城市建设门户网站
  • 在手机上如何制作网站qq注册网页入口
  • asp.net程序做的网站安全吗国内什么网站用asp.net
  • 凡科网做网站网站编辑知识
  • c#做交易网站taxonomy wordpress
  • 统一门户网站开发员给我用织梦做的网站
  • 网站上有声的文章是怎么做的深圳市住房和建设局网站和市住宅租赁管理服务中心
  • 如何对网站进行爬虫页面设计存在的问题
  • 知名网站建设加盟合作企业邮箱如何登录
  • asp net mvc做网站软文推广是什么
  • 张家口住房和城乡建设厅网站如何做点击赚钱的网站
  • 网站在建设中无法访问贵州碧江区住房和城乡建设局网站
  • 营销类网站 英文东莞正规的免费网站优化
  • 柳州网站推广最好的公司百度seo优化培训
  • 哈尔滨门户网站建站哪个网站做农产品