当前位置: 首页 > news >正文

iis网站拒绝显示此网页wordpress工程师

iis网站拒绝显示此网页,wordpress工程师,郑州设计公司招聘,wordpress 怎么加页面正则表达式在NLP中的基本应用正则表达式的作用#xff1a;(1)将文档内容从非结构化转为结构化以便后续的文本挖掘(2)去除“噪声”#xff0c;在处理大量文本片段的时候#xff0c;有非常多的文字信息与最终输出的文本无关。这些无关的片段称之为“噪声”。1. 匹配字符串在Py…正则表达式在NLP中的基本应用正则表达式的作用(1)将文档内容从非结构化转为结构化以便后续的文本挖掘(2)去除“噪声”在处理大量文本片段的时候有非常多的文字信息与最终输出的文本无关。这些无关的片段称之为“噪声”。1. 匹配字符串在Python中会使用re模块来实现正则表达式。re.search(regres,string)该方法可也检查这个string字符串是否匹配正则表达式regex。如果表达式匹配则会返回一个match对象如果没有匹配则返回None。例1获取包含“爬虫”这个关键字的句子查找哪些语句包含“爬虫”这个关键字python的代码实现如下import retext_string 文本最重要的涞源无疑是网络。我们要把网络中的文本获取形成一个文本数据库。 \利用一个爬虫抓取到网络中的信息。爬取的策略有广度爬取和深度爬取。 \根据用户的需求爬虫可以有主题爬虫和通用爬虫之分。regrex 爬虫p_string text_string.split(。) # 以句号为分隔符通过split切分for line in p_string:if re.search(regrex,line) is not None: # search方法是用来查找匹配当前行是否匹配这个regrex,返回的是一个match对象print(line) # 如果匹配到打印这行信息上述代码的运行结果利用一个爬虫抓取到网络中的信息根据用户的需求爬虫可以有主题爬虫和通用爬虫之分同理查找哪些语句包含“文本”这个关键字python的代码实现如下import retext_string 文本最重要的涞源无疑是网络。我们要把网络中的文本获取形成一个文本数据库。 \利用一个爬虫抓取到网络中的信息。爬取的策略有广度爬取和深度爬取。 \根据用户的需求爬虫可以有主题爬虫和通用爬虫之分。regrex 文本p_string text_string.split(。) # 以句号为分隔符通过split切分for line in p_string:if re.search(regrex,line) is not None: # search方法是用来查找匹配当前行是否匹配这个regrex,返回的是一个match对象print(line) # 如果匹配到打印这行信息代码运行结果如下文本最重要的涞源无疑是网络我们要把网络中的文本获取形成一个文本数据库例2 匹配任意一个字符正则表达式中有一些保留的特殊符号可以帮助我们处理一些常用逻辑。符号含义.匹配任意一个字符举例正则表达式可以匹配的例子不能匹配的例子“a.c”“abc”,“branch”“add”,“crash”“…t”“bat”,“oat”“it”,“table”提示.代替任何单个字符(换行符除外)现在演示如何查找包含“爬”任意一个字的句子代码如下import retext_string 文本最重要的涞源无疑是网络。我们要把网络中的文本获取形成一个文本数据库。 \利用一个爬虫抓取到网络中的信息。爬取的策略有广度爬取和深度爬取。 \根据用户的需求爬虫可以有主题爬虫和通用爬虫之分。regrex 爬.p_string text_string.split(。) # 以句号为分隔符通过split切分for line in p_string:if re.search(regrex,line) is not None: # search方法是用来查找匹配当前行是否匹配这个regrex,返回的是一个match对象print(line) # 如果匹配到打印这行信息运行结果如下利用一个爬虫抓取到网络中的信息爬取的策略有广度爬取和深度爬取根据用户的需求爬虫可以有主题爬虫和通用爬虫之分同理查找包含“用户”任意一个字的句子代码如下import retext_string 文本最重要的涞源无疑是网络。我们要把网络中的文本获取形成一个文本数据库。 \利用一个爬虫抓取到网络中的信息。爬取的策略有广度爬取和深度爬取。 \根据用户的需求爬虫可以有主题爬虫和通用爬虫之分。regrex 用户.p_string text_string.split(。) # 以句号为分隔符通过split切分for line in p_string:if re.search(regrex,line) is not None: # search方法是用来查找匹配当前行是否匹配这个regrex,返回的是一个match对象print(line) # 如果匹配到打印这行信息代码运行结果如下根据用户的需求爬虫可以有主题爬虫和通用爬虫之分例3匹配起始和结尾字符串符号含义[ ]匹配多个字符举例“[bcr]at” 代表的是匹配bat cat以及 “rat”以下文字句子和句子之间以逗号分隔​ [重要的]今年第七号台风23日登陆广东东部沿海地区。​ 上海发布车库销售监管通知违规者暂停网签资格。​ [紧要的]中国对连发强硬信息印度急切需要结束对峙。希望提取以[重要的]或者[紧要的]为起始的新闻标题。代码如下import retext_string [[重要的]今年第七号台风23日登陆广东东部沿海地区。,上海发布车库销售监管通知违规者暂停网签资格。,[紧要的]中国对连发强硬信息印度急切需要结束对峙。]regrex ^\[[重紧]..\]for line in text_string:if re.search(regrex,line) is not None:print(line)else:print(not match)运行结果如下[重要的]今年第七号台风23日登陆广东东部沿海地区。not match[紧要的]中国对连发强硬信息印度急切需要结束对峙。观察数据我们发现一些新闻标题是以[重要的] “[紧急的]“为起始所以需要添加”^“特殊符号代表起始之后因为存在重或紧”所以我们使用”[ ]“匹配多个字符然后以”. “.” 代表之后的任意两个字符。2.使用转义符上述代码中使用\为转义符因为[ ]在正则表达式中是特殊符号。如果需要匹配文本中的字符\那么使用编程语言表示的正则表达式里将需要4个反斜杠\\\\前两个和后两个分别用于在编程语言里转义成反斜杠转换成两个反斜杠后再在正则表达式里转义成一个反斜杠。在Python中可使用r\\表示。匹配一个数字的\\d可以写成r\d。有了原生字符串表达式更为直观。举例匹配字符串中的反斜杠nee\dle。import reif re.search(\\\\,I have one nee\dle):print(match it)else:print(not match)运行结果match it另一种写法if re.search(r\\, I have one nee\dle):print(match it)else:print(not match)3. 抽取文本中的数字(1)通过正则表达式匹配年份[0-9]“代表的是从0到9的所有数字相对的”[a-z]代表的是从a到z的所有小写字母。例首先定义一个list分配一个变量strings匹配年份是1000年2999年之间。代码如下import reyear_strings []strings [war of 1812,There are 5280 feet to a mile,Happy New Year 2016!]for string in strings:# print(string)if re.search([1-2][0-9]{3},string):year_strings.append(string)print(year_strings)上述代码中[1-2][0-9]{3}表示的是字符串有英文有数字匹配其中的数字部分并且是在10002999之间{3}代表的是重复之前的[0-9]三次是[0-9][0-9][0-9]的简化写法。(2)抽取所有的年份使用Python中的re模块的另一个方法findall()来返回匹配带正则表达式的那部分字符串。re.findall([a-z],abc1234)得到的结果是[a,b,c]。例定义一个字符串years_string其中的内容是2015 was a good year, but 2016 will be better!。现在抽取一下所有的年份。代码如下import reyears_string 2016 was a good year, but 2017 will be better!years re.findall([2][0-9]{3},years_string)print(years)运行结果[‘2016’, ‘2017’]
http://www.zqtcl.cn/news/511351/

相关文章:

  • 上海门户网站怎么登录网站开发竞价单页
  • 东莞市外贸网站建设公司软件开发 系统开发 网站开发服务
  • 泉州制作网站设计南宁网站排名外包
  • 南通网站建设入门wordpress google seo
  • 怎么建立图片的网站吗网站响应式是什么意思
  • 网站建设买了服务器后怎么做WordPress多城市
  • 网站建设凭证成都网站设计公司
  • 创新创业营销策略网站建设等做钢材的都用什么网站
  • 英文免费网站模板大庆+网站建设
  • 品牌网站建设内容框架网站首页收录没了
  • 湖南城乡住房建设厅网站网站图片切换效果
  • 凡科做的网站可以在百度搜到吗阿里云nas做网站
  • 做企业销售分析的网站更改wordpress传文件尺寸
  • 网站建设策划书封面知名企业名称
  • 中小企业网站建设与管理课件百度云济南高端网站建设公司
  • 台州企业建站程序网页设计素材网站知乎
  • wordpress视频付费谷歌seo专员是指什么意思
  • 域名续费做网站wordpress模板淘宝客模板
  • 加强政协机关网站建设深圳教育软件app开发
  • 绍兴企业网站推广Django 个人博客网站开发
  • html5 开发网站图门市建设局网站
  • wordpress 建立网站江苏电信网站备案
  • 企业网站能个人备案吗成都蜀美网站建设
  • 网站开发 占位符直播网站开发接入视频
  • 网站 易用性原则义乌进货网平台
  • 做网站的你选题的缘由是什么洛阳网站建设找汉狮
  • 常德住房和城乡建设局网站陕西省建设厅的网站
  • 国外做meta分析的网站开发公司替业主承担物业费承诺书
  • 百度收录网站定位地址wordpress 检测浏览器
  • 学习网站建设优化wordpress 轮播广告