当前位置: 首页 > news >正文

迅速提高网站排名网站弹出咨询这个怎么做

迅速提高网站排名,网站弹出咨询这个怎么做,wordpress 更改地址,淘宝做网站价格文章目录 三种抓取方式数据抓取的流程获取文章具体操作 获取用户获取图片jsoup操作 三种抓取方式 直接调用请求接口(最方便#xff0c;这里使用该方法) HttpClient,OKHttp,RestTemplate,Hutool等网页渲染出明文内容后#xff0c;从前端页面的内容抓取有些网站可能是动态请求… 文章目录 三种抓取方式数据抓取的流程获取文章具体操作 获取用户获取图片jsoup操作 三种抓取方式 直接调用请求接口(最方便这里使用该方法) HttpClient,OKHttp,RestTemplate,Hutool等网页渲染出明文内容后从前端页面的内容抓取有些网站可能是动态请求的不会一次性加载所有的数据而是要你点击某个按钮输入某个验证码才会显示出数据 - 无头浏览器 数据抓取的流程 分析数据源怎么获取拿到数据后怎么处理写入数据库等存储 获取文章 离线抓取方式 具体操作 过滤请求 将响应的数据复制到data/passage.json文件中 引入Hutool依赖 !-- https://hutool.cn/docs/index.html#/ -- dependencygroupIdcn.hutool/groupIdartifactIdhutool-all/artifactIdversion5.8.16/version /dependency查看官方文档 https://hutool.cn/docs/index.html#/ 编写测试类 获取用于爬虫的数据 编写测试类 SpringBootTest public class CrawlerTest {Resourceprivate PostService postService;Testvoid testFetchPassage() {//1.获取数据String json {\current\:1,\pageSize\:8,\sortField\:\createTime\,\sortOrder\:\descend\,\category\:\文章\,\tags\:[],\reviewStatus\:1};String url https://api.code-nav.cn/api/post/search/page/vo;String result HttpRequest.post(url).body(json).execute().body();//2.处理数据:json转对象MapString, Object map JSONUtil.toBean(result, Map.class);JSONObject data (JSONObject) map.get(data);JSONArray records (JSONArray) data.get(records);ListPost postList new ArrayList();for (Object record : records) {Post post new Post();JSONObject tempRecord (JSONObject) record;post.setId(0L);post.setTitle(tempRecord.getStr(title));post.setContent(tempRecord.getStr(content));//这里将json数组转为列表再转为json字符串不知道是为了干什么为什么不直接把json数组转为json字符串呢JSONArray tags (JSONArray) tempRecord.get(tags);ListString tagList tags.toList(String.class);// System.out.println(JSONUtil.toJsonStr(tags));post.setTags(JSONUtil.toJsonStr(tagList));System.out.println(JSONUtil.toJsonStr(tagList));post.setUserId(1L);postList.add(post);//3.写入数据库postService.saveBatch(postList);}} } 写入一次性任务 // 取消Component注释每次项目启动都会执行run任务 //Component Slf4j public class FetchInitPostList implements CommandLineRunner {Resourceprivate PostService postService;Overridepublic void run(String... args) {//1.获取数据String json {\current\:1,\pageSize\:8,\sortField\:\createTime\,\sortOrder\:\descend\,\category\:\文章\,\tags\:[],\reviewStatus\:1};String url https://api.code-nav.cn/api/post/search/page/vo;String result HttpRequest.post(url).body(json).execute().body();//2.处理数据:json转对象MapString, Object map JSONUtil.toBean(result, Map.class);JSONObject data (JSONObject) map.get(data);JSONArray records (JSONArray) data.get(records);ListPost postList new ArrayList();for (Object record : records) {Post post new Post();JSONObject tempRecord (JSONObject) record;post.setId(0L);post.setTitle(tempRecord.getStr(title));post.setContent(tempRecord.getStr(content));//这里将json数组转为列表再转为json字符串不知道是为了干什么为什么不直接把json数组转为json字符串呢JSONArray tags (JSONArray) tempRecord.get(tags);ListString tagList tags.toList(String.class);//JSONUtil.toJsonStr(tags);post.setTags(JSONUtil.toJsonStr(tagList));post.setUserId(1L);postList.add(post);//3.写入数据库postService.saveBatch(postList);}} } 获取用户 每个网站的用户都是自己的没必要抓取 获取图片 实时抓取我们自己的网站不存在这些数据用户要搜的时候直接从别人的接口网站去搜 jsoup库获取到HTML文档然后从中解析出需要的字段 jsoup操作 导入依赖 !-- https://mvnrepository.com/artifact/org.jsoup/jsoup -- dependencygroupIdorg.jsoup/groupIdartifactIdjsoup/artifactIdversion1.15.3/version /dependency打开官网 https://jsoup.org/获取示例代码 Document doc Jsoup.connect(https://en.wikipedia.org/).get(); log(doc.title()); Elements newsHeadlines doc.select(#mp-itn b a); for (Element headline : newsHeadlines) {log(%s\n\t%s, headline.attr(title), headline.absUrl(href)); }通过在网页前端html界面找对应的css选择器拿到需要的内容测试代码 //抓取图片Testvoid testFetchPicture() throws IOException {int current 1;String url https://cn.bing.com/images/search?q%E5%B0%8F%E9%BB%91%E5%AD%90formHDRSC2first current;Document doc Jsoup.connect(url).get();Elements elements doc.select(.iuscp.isv); //数组每个元素是每一张图片for (Element element : elements) {//取图片地址murlString m element.select(.iusc).attr(m);MapString,Object map JSONUtil.toBean(m, Map.class);String murl (String) map.get(murl);//取标题String title element.select(.inflnk).attr(aria-label);System.out.println(murl);System.out.println(title);}}
http://www.zqtcl.cn/news/755492/

相关文章:

  • 中学网站模板下载番禺外贸网站建设
  • 常州网站seo代理加盟郑州浩方网站建设智联招聘
  • 小型网站制作网站开发做什么费用
  • seo网站论文社交app开发公司
  • 企业宣传网站建设图示《高性能网站建设》
  • 福州志愿者官方网站怎么做erp管理系统介绍
  • 高端网站建设费用情况广州开发区控股集团有限公司
  • 精湛的网站设计云南网招聘
  • 南昌网站建设公司行情Wordpress添加分页按钮
  • 论坛网站建设流程wordpress速度优化插件
  • PHP套模板做网站建设银行保定分行网站
  • 怎样免费注册网站域名wordpress网站回调域
  • 东莞个人免费建网站乐清网约车事件
  • 备案查询网站网站的登录弹窗怎么做
  • 网站开发 mvc北京建设工程主管部门网站
  • 淮安建设机械网站制作代理公司注册需要多少钱
  • 站长收录茌平建设局网站
  • 如何进行网站开发开发区人才
  • 网站制作 视频网站维护的主要内容包括
  • 快速企业建站深圳网站关键词优化推广
  • 如何开网店详细步骤东莞市网络seo推广
  • 个人可以做哪些有意思的网站网站和网站的app
  • 北京高端网站开发公司网站建设后台实训体会
  • 青岛海川建设集团有限公司网站wordpress 变私有云
  • 网站备案人可以改吗石大网页设计与网站建设客观题
  • 宁波网站优化方案免费关键词挖掘工具
  • 网站制作想法免费做效果图网站
  • 晓风彩票网站建设软件微信上发的链接网站怎么做的
  • 关键词有哪几种台州优秀关键词优化
  • 盐田区住房和建设局网站软件开发文档怎么编写