当前位置: 首页 > news >正文

网站备案和服务器备案企业cms免费模板

网站备案和服务器备案,企业cms免费模板,国家新闻出版,wordpress注册免邮件如果对htmlunit还不了解的话可以参考Java#xff1a;爬虫htmlunit-CSDN博客 了解了htmlunit之后#xff0c;我们再来学习如何在页面中抓取我们想要的数据#xff0c;我们在学习初期可以找一些结构比较清晰的网站来做测试爬取#xff0c;首先我们随意找个网站如下#xff…如果对htmlunit还不了解的话可以参考Java爬虫htmlunit-CSDN博客 了解了htmlunit之后我们再来学习如何在页面中抓取我们想要的数据我们在学习初期可以找一些结构比较清晰的网站来做测试爬取首先我们随意找个网站如下 当我们打开网站F12进入开发者模式我们在学习之前我们需要知道我们要爬取什么数据了解数据和页面的结构。就拿这个网站来说我们如果要爬取它的数据首先需要获取他们的类别在获取类别下的数据。那我们在点击类别的时候需要分析下地址有没有变化如果变化了我们需要拿到指定类别的地址然后和域名拼接成完整地址抓取其类目下的数据。 为什么要拼接呢因为在网站类目使用的跳转会自动加上站点地址我们在爬取的时候是没有该网站域名的。 这个列子非常简单我们直接要获取它的类别跳转的地址再根据爬取的地址爬取其详情数据 分析下来我们只要抓取该页面的a标签即可。这个在 htmlunit 中提供了 HtmlAnchor 直接可以获取所有的a标签代码如下 /*** bFunction: /b todo** program: 根据页面信息获取子页面信息* Package: com.kingbal.king.dmp* author: dingcho* date: 2024/06/13* version: 1.0* Copyright: 2024 www.kingbal.com Inc. All rights reserved.*/ Slf4j public class BaseTest {public static void main(String[] args) throws Exception {HtmlPage page SpiderUtils.crawlPageWithoutAnalyseJs(https://www.yiyiwiy.com/);//System.err.println(page);ListHtmlAnchor htmlAnchorList page.getAnchors();log.info(htmlAnchorList.size() htmlAnchorList.size());log.info(********************);htmlAnchorList.forEach(f - {if(f.getHrefAttribute().contains(vodtypehtml)){log.info(f.getHrefAttribute());}});log.info(********************);}}我们抓取的是所有页面的a标签所以我们需要过滤掉我们不需要的地址 if(f.getHrefAttribute().contains(vodtypehtml)){log.info(f.getHrefAttribute()); } 然后执行代码就可以获取到对应数据
http://www.zqtcl.cn/news/620630/

相关文章:

  • 做效果图的外包网站徐州低价seo
  • xp系统中做网站服务器吗网站设计版权
  • 化妆品网站建设经济可行性分析怎么做好网站
  • 软件企业网站建设栏目结构图服务公司有哪些
  • 郑州专业做淘宝网站推广哪些公司需要网站开发工程师
  • 如何为企业做网站单页网站推广
  • 做公众号封面图的网站凡客精选app
  • 张家界做旅游网站网业小说畅读服务
  • 短租网站那家做的好网络设计工作好找吗
  • 企业建网站哪家好网络书签 wordpress
  • 网站策划的工作职责有关网站开发的创意
  • 上国外网站dns如何免费做网站推广
  • wordpress导航站的源码网页设计与制作微课教程第4版李敏
  • 建站的好公司wordpress 小工具 调用
  • 郑州高考网站建设wordpress调用多个底部
  • 在线做爰直播网站dw制作网页步骤
  • 视频网站 php源码深圳高端网站建设招聘
  • 企业网站服务费怎么做记账凭证那个网站上有打码的任务做
  • 沈阳做网站优化的公司长春网络建站模板
  • 秒收网站鞍山58同城
  • 模板网站建设方案wordpress系统在线升级
  • 男女做爰视频网站在线视频seo也成搜索引擎优化
  • 网站优化和网站推广深圳市高端网站建设
  • 宁波网站建设优化企业推荐四川省建设厅新网站
  • 哈尔滨模板自助建站优秀的电子商务网站
  • 有站点网络营销平台wordpress 退出 跳转
  • 网站建设的内容规划国内做网站群平台的公司
  • 浙江省院士专家工作站建设网站网站的请求服务做优先级
  • 建一个国外网站多少钱邵阳建设银行网站是多少
  • h5页面有哪些seo关键词智能排名