当前位置: 首页 > news >正文

如何做网站数据库怎么查询网站点击量

如何做网站数据库,怎么查询网站点击量,企业门户网站模板分享,wordpress 360友链我想写一个查询话费和流量的爬虫#xff0c;关键是实现模拟登陆的这个部分。在登陆过程中#xff0c;点击登陆之后#xff0c;登陆表单会 post 到一个地址(这一步浏览器不显示)#xff0c;然后会 302 跳转到登陆成功的页面。我现在想得到登陆成功的 cookies #xff0c;不…我想写一个查询话费和流量的爬虫关键是实现模拟登陆的这个部分。在登陆过程中点击登陆之后登陆表单会 post 到一个地址(这一步浏览器不显示)然后会 302 跳转到登陆成功的页面。我现在想得到登陆成功的 cookies 不知道该怎么提取requests.session()并没有得到登陆成功的 cookies.得不到登陆成功的 cookies 代码就不能爬取登陆之后的查询信息。我有三个问题1.post 表单这个过程也就是图一中的 cookies 是怎么生成的因为我发现 post 表单过程中的 cookies 比在进入登陆页面中的多。2.登陆过程中有两次 302 最后再 200 到登陆成功页面我该怎么得到 200 的这个 cookie 。3.request.sission()是会自动管理登陆过程中的 cookies 吗用不用单独提取登陆之后的 cookies 。代码如下谢谢大家#codingutf-8import requestsimport re# request headersHead {Accept-Language: zh-CN,zh;q0.8, Accept-Encoding: gzip, deflate, sdch, Host: ah.189.cn,Accept: text/html,application/xhtmlxml,application/xml;q0.9,image/webp,*/*;q0.8, Upgrade-Insecure-Requests: 1, Connection: keep-alive, Cache-Control: max-age0,User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/51.0.2704.106 Safari/537.36}# Chrome 打开登陆页面提取的 cookiesCook {Hm_lvt_333c7327dca1d300fd7235c159b7da04: 1469964315,lid: , _gscu_1758414200: 69964315ee6pb621, v_lasttime: 1469964315502,_gscs_1758414200: 69964315tq317521|pv:1, Hm_lvt_c7c8eed8670bd7fffefc8b202fe0904d: 1469964315,v_url_code: http%3A//ah.189.cn/sso/login%3FreturnUrl%3D%252Fbiz%252Fservice%252Faccount%252Finit.action,JSESSIONID_SSO: Jh1GXdgDZJqdZqpLvRQvZzdlvT7y6BxHhCny9MhbKh1Kw1hSLNt2Q1c6231LrHQWrpDL4m115pz0YTLJN7jx2fmpTfPBx1JwlYvvkLBRySmy18tnW1c2Q7qPvQqK9kJP!463350529,v_trackId: 1BD7B46E79FE234CE9C67E49D95245FB, Hm_lpvt_333c7327dca1d300fd7235c159b7da04: 1469964315,_gscbrs_1758414200: 1, Hm_lpvt_c7c8eed8670bd7fffefc8b202fe0904d: 1469964315,JSESSIONID_PERSONWEB: p2MyXdgGd8f5phjTTv2CJMr6J8QYhSyLX0kkZHlSwpppjhYGf3qm!1538637772}#登陆提交的表单postdata {remPwd: 0,loginName: ,returnUrl: /biz/service/account/init.action,validCode: ,loginType: 4, sysId: 1003, passType: 0,csrftoken: ,accountType: 9, ssoAuth: 0,passWord: ,latnId: 551}#登陆页面baseurl http://ah.189.cn/sso/login?returnUrl%2Fbiz%2Fservice%2Faccount%2Finit.action#登陆表单 post 的地址posturl http://ah.189.cn/sso/LoginServletsess requests.session()sess.headers.update(Head)def getP(url,cookies):带 session()requests 的 get 方法pre sess.get(url,cookies cookies)return predef getVerifyURL(url):从主页提取验证码地址reg r/sso/VImage.servlet\?random0\.[0-9] #正则表达式匹配验证码图片链接img re.search(reg,getP(url,cookies Cook).content).group()imge http://ah.189.cn img #得到验证码图片链接return imgedef getCodePic():下载验证码图片verifyURL getVerifyURL(baseurl)codePic getP(verifyURL,cookies Cook).contentprint verifyURLwith open(x.jpeg,wb) as jpg:jpg.write(codePic)def postData():post 表单信息更新username raw_input(输入手机号)code raw_input(输入密码)passwd raw_input(输入验证码)postdata[loginName] str(username)postdata[validCode] str(code)postdata[passWord] str(passwd)getCodePic()postData()postover sess.post(posturl,postdata) #post 表单cookLogin postover.cookies #查看 post 表单之后的 cookiesprint cookLogincon sess.get(http://ah.189.cn/biz/service/account/init.action)#登陆成功的页面print 登陆成功,con
http://www.zqtcl.cn/news/376405/

相关文章:

  • 电子商务网站推广论文网站规划思想方法有哪些内容
  • adsl做网站无锡免费网站制作
  • 怎么利用网站开发app免费软件库合集软件资料网站
  • 做变形字的网站工程公司简介模板
  • 网站建设网页怎么排列顺序网站制作 用户登录系统
  • 音乐网站用什么语言做深圳网站排名优化公司
  • h5响应式网站建设方案南京做微网站
  • 建设班级网站首页查注册公司什么网站
  • 中小企业网站建设平台网站开发技术大学教材
  • 有四川建设人才网这个网站吗青岛外贸网站运营哪家好
  • 网站建设j介绍ppt模板注册企业公司流程及费用
  • 建网站多少费用设计公司推荐
  • 东莞市营销网站建设哪个推广网站好
  • 上海青浦房地产网站建设广西建设人才网
  • 做网站的网络公司税收优惠推广优化关键词
  • 找能做网站的怎么查看网站备案号
  • 石嘴山北京网站建设h5网站建设
  • 滨州区建设局网站中国建行官网首页
  • 网站建设服务网站网站建设销售实习
  • 网站注册都需要什么给装修公司做推广的网站
  • me域名的网站wordpress 扩展字段
  • 新开三端互通传奇网站企业推广方式有哪些
  • 怎么制作网站页面做理论的网站
  • 哪家公司做跳转网站wordpress 网页缩放
  • 小说网站建设的支柱深圳建设发展集团有限公司
  • 陕西高速公路建设网站做网站不用编程
  • wordpress网站秒开网站建设设计理念
  • html5 网站模板永久免费的仓库管理软件
  • 贵州网站seo厦门网站设计多少钱
  • 哈市哪里网站做的好合作网站seo