当前位置: 首页 > news >正文

vue可以做pc端网站吗理财网站开发

vue可以做pc端网站吗,理财网站开发,深圳企业网站制作哪家好,网站原创文章不收录文章目录 概要介绍如何学习官方文档如何安装快速开始如何配置调试分布式代理层面执行层面存储层面存储多收集器配置优化持久化存储启用异步加快任务执行禁止或限制 KeepAlive 连接扩展总结如果想用 GO 实现爬虫能力,该如何做呢?抽时间研究了 Go 的一款爬虫框架 colly。 概要… 文章目录 概要介绍如何学习官方文档如何安装快速开始如何配置调试分布式代理层面执行层面存储层面 存储多收集器配置优化持久化存储启用异步加快任务执行禁止或限制 KeepAlive 连接 扩展总结 如果想用 GO 实现爬虫能力,该如何做呢?抽时间研究了 Go 的一款爬虫框架 colly。 概要介绍 colly 是 Go 实现的比较有名的一款爬虫框架,而且 Go 在高并发和分布式场景的优势也正是爬虫技术所需要的。它的主要特点是轻量、快速,设计非常优雅,并且分布式的支持也非常简单,易于扩展。 如何学习 爬虫最有名的框架应该就是 Python 的 scrapy,很多人最早接触的爬虫框架就是它,我也不例外。它的文档非常齐全,扩展组件也很丰富。当我们要设计一款爬虫框架时,常会参考它的设计。之前看到一些文章介绍 Go 中也有类似 scrapy 的实现。 相比而言,colly 的学习资料就少的可怜了。刚看到它的时候,我总会情不自禁想借鉴我的 scrapy 使用经验,但结果发现这种生搬硬套并不可行。 到此,我们自然地想到去找些文章阅读,但结果是 colly 相关文章确实有点少,能找到的基本都是官方提供的,而且看起来似乎不是那么完善。没办法,慢慢啃吧!官方的学习资料通常都会有三处,分别是文档、案例和源码。 今天,暂时先从官方文档角度吧!正文开始。 官方文档 官方文档介绍着重使用方法,如果是有爬虫经验的朋友,扫完一遍文档很快。我花了点时间将官网文档的按自己的思路整理了一版。 主体内容不多,涉及安装、快速开始、如何配置、调试、分布式爬虫、存储、运用多收集器、配置优化、扩展。 其中的每篇文档都很短小,甚至是少的基本都不用翻页滚动。 如何安装 colly 的安装和其他的 Go 库安装一样简单。如下: go get -u github.com/gocolly/colly一行命令搞定。So easy! 快速开始 我们来通过一个 hello word 案例快速体验下 colly 的使用。步骤如下: 第一步,导入 colly。 import "github.com/gocolly/colly"第二步,创建 collector。 c := colly.NewCollector()第三步,事件监听,通过 callback 执行事件处理。 // Find and visit all links c.OnHTML("a[href]", func(e *colly.HTMLElement) {link := e.Attr("href")// Print linkfmt.Printf("Link found: %q - %s\n", e.Text, link)// Visit link found on page// Only those links are visited which are in AllowedDomainsc.Visit(e.Request.AbsoluteURL(link)) })c.OnRequest(func(r *colly.Request) {fmt.Println("Visiting", r.URL) })我们顺便列举一下 colly 支持的事件类型,如下: OnRequest 请求执行之前调用OnResponse 响应返回之后调用OnHTML 监听执行 selectorOnXML 监听执行 selectorOnHTMLDetach,取消监听,参数为 selector 字符串OnXMLDetach,取消监听,参数为 selector 字符串OnScraped,完成抓取后执行,完成所有工作后执行OnError,错误回调最后一步,c.Visit() 正式启动网页访问。 c.Visit("http://go-colly.org/")案例的完成代码在 colly 源码的 _example 目录下 basic 中提供。 如何配置 colly 是一款配置灵活的框架,提供了大量的可供开发人员配置的选项。默认情况下,每个选项都提供了较优的默认值。 如下是采用默认创建的 collector。 c := colly.NewCollector()配置创建的 collector,比如设置 useragent 和允许重复访问。代码如下: c2 := colly.NewCollector(colly.UserAgent("xy"),colly.AllowURLRevisit(), )我们也可以创建后再改变配置。 c2 := colly.NewCollector() c2.UserAgent = "xy" c2.AllowURLRevisit = truecollector 的配置可以在爬虫执行到任何阶段改变。一个经典的例子,通过随机改变 user-agent,可以帮助我们实现简单的反爬。 const letterBytes = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"func RandomString() string {b := make([]byte, rand.Intn(10
http://www.zqtcl.cn/news/397079/

相关文章:

  • 营销型的物流网站模板下载长江设计公司
  • 网站程序制作购买网站域名
  • 网站建设中html下载如何用社交网站开发客户
  • 开设购物网站的方案政务公开和网站建设情况
  • 一台云服务器做多个网站营销型网站的建设重点是什么
  • 泉港网站建设推广服务公司电子商务好就业吗
  • 自己做网站开发如何找客户wordpress 显示 子分类
  • 腾讯邮箱网页版登录宿迁seo公司
  • 网站建设找盖亚科技WordPress 百度 主动
  • 中国最受欢迎的网站杭州做电商网站
  • 百度招聘 网站开发全网营销实战培训
  • 备案网站内容说明广州哪个区封了
  • 大足建网站的软件开发者模式怎么打开
  • 中国有什么网站做跨境零售农商1号的网站建设费
  • 用宝塔给远程网站做备份购买一个网站需要多少钱
  • 百度蜘蛛不爬取网站做汽车新闻哪个网站好
  • 三维建设项目管理网站免费下载网站模板
  • 淘客联盟做任务网站页面设计所遵循的原则有哪些
  • 怎么建设收费网站行业网站建站
  • 织梦园模板网站自适应网站建设服务哪家好
  • 优秀专题网站恩施北京网站建设
  • 常用网站后缀企业网站用什么域名
  • 网站建设定制公众号小程序51ppt模板免费下载完整版免费ppt
  • 个人网站工商备案济南建网站app
  • 佛山网站建设公司哪家性价比高2018建设网站
  • 公司建一个网站建设工程教育网网址
  • 一级a做爰片免播放器网站推广渠道包括哪些
  • 南京市建设工程档案馆网站新乡市四合一网站建设
  • 网站建设制作周期咸宁网站设计制作
  • 网站推广营销联系方式南宁做网站推广的公司