十堰网站免费建设,雨花区最新情况,贵阳建站推广公司,太原网站建设加q.479185700讲解视频#xff1a;可以在bilibili搜索《MATLAB教程新手入门篇——数学建模清风主讲》。
MATLAB教程新手入门篇#xff08;数学建模清风主讲#xff0c;适合零基础同学观看#xff09;_哔哩哔哩_bilibili 本案例将引导大家爬取亚洲各地区的实时时间。我们将从下面这个网… 讲解视频可以在bilibili搜索《MATLAB教程新手入门篇——数学建模清风主讲》。
MATLAB教程新手入门篇数学建模清风主讲适合零基础同学观看_哔哩哔哩_bilibili 本案例将引导大家爬取亚洲各地区的实时时间。我们将从下面这个网站中获取数据现在亚洲时间_亚洲时间表_亚洲时间与北京时间_亚洲时区天气网时差频道time.tianqi.com为您提供亚洲时间表可进行亚洲时间在线查询与换算和亚洲时间与北京时间对比更有按亚洲时区划分的亚洲城市时间查询。https://time.tianqi.com/asia_shijian
首先请大家在自己的电脑上打开浏览器并输入上述网址访问该网站。网站打开后我们会看到亚洲各个地区的实时时间。 接下来为了更好地帮助大家理解爬虫的流程我们需要查看网页的源代码。这可以通过在浏览器的当前网站中点击鼠标右键然后选择“查看网页源代码”来实现请注意本书示例使用的是谷歌Chrome浏览器不同的浏览器可能在功能名称上略有差异。 当你打开网页源代码后会看到一大堆由HTML标签组成的代码。这些代码定义了网页的结构和内容。我们的目标是从中找到与我们需要的实时时间数据相关的部分。 一种有效的方法是在源代码中搜索我们想要提取的数据的关键词快捷键CtrlF比如“阿联酋”。这样就能快速定位到我们所需的数据在源码中的位置。 接下来我们可以将整个网页源代码视为一个文本并从这个文本中提取出我们感兴趣的数据即各地区的名称和对应的实时时间。提取数据的方法有多种既可以使用之前学过的文本处理函数也可以使用本章介绍的正则表达式。通常情况下网页源码中的数据在结构上具有一定的规律性这时使用正则表达式进行提取通常会更加高效和方便。
在之前未掌握爬虫技术时我们需要手动查看网页源代码将其复制粘贴到文本文件中或者将整个网页保存为HTML文件然后再使用fileread函数将源码读取到MATLAB中。这样的操作繁琐且耗时且对于本题而言爬取的时间也失去了实时性。
然而现在我们将利用MATLAB的webread函数直接获取网页的源代码。这一自动化的过程不仅省去了手动保存的繁琐步骤更大大提高了数据获取的效率。
webread函数是MATLAB中用于获取网页内容的函数。在使用之前我们可以通过weboptions函数来明确指出网页的字符编码这样能避免在某些网站中可能出现的字符乱码问题。接下来我们将展示如何使用这两个函数来获取指定网址的网页源代码。 有同学可能会有疑惑为什么要指定这个网页的文本编码为utf-8而不是gbk。这里告诉大家一个小技巧大家可以在网页源码中搜索charset这个关键词通常会找到类似下面的代码注意这个技巧适用于绝大多数的网站 点击下方的CSDN专栏阅读下一篇文章
MATLAB入门课程专栏