当前位置: 首页 > news >正文

logo设计制作网站网站开发报告多少页合适

logo设计制作网站,网站开发报告多少页合适,成都旅游十大必去景区,绍兴市科信建设工程检测中心网站统计文本文件中高频词是常见操作#xff08;参考文章#xff1a;Linux centos7 高频词统计#xff09;。而查找并统计文本文件中共有多少单词#xff08;独立字符串#xff0c;包括中文或数字串#xff09;也是一项很好地实践项目。 本文主要应用命令替换、循环结构、so…统计文本文件中高频词是常见操作参考文章Linux centos7 高频词统计。而查找并统计文本文件中共有多少单词独立字符串包括中文或数字串也是一项很好地实践项目。 本文主要应用命令替换、循环结构、sort、grep及awk命令等达到目标。最后剖析不同方法的差异且且提出使用建议。 bash中如何从文本文件中提取所有单词主要有四维思路用grep方法搜索所有单词存入一个变量for循环遍历所有单词while循环查找所有单词存入一个数组或打印输出awk打印所有行之所有字段。 讨论项目主要目标获取文件中的所有单词是批独立数字串或英文字符串的简称。仅存储每个单词一次且不区分大小写。 本文训练素材 cat test4.txt 123 222 345 my name is shantong 12345 789 my qq number is 36142959 my email is 36142959qq.com my ip is 192.168.1.141 my name is zhange My telephone num is 13523072436 My qq number is 845537614 Server_name is Softeem Company Site is http://www.pili-zz.net MMMM1234 192.168.89.115 一、grep grep命令可以搜索单词加参数 –w或在搜索字符前后加\b;或在搜索字符前加\ 后加\ 而用对于未知的单词可以使用posix字符[[:alpha:]]或\w WORDSgrep -o -E \w filename | sort -u -f grep –o  仅显示匹配内容 grep –E  搜索表达式可用扩展正则 由grep搜索到的单词是所有文本文件的单词有大量重复的通过排序、去重忽略大小写可以用sort -u –f达到单词唯一。 sort –u 排序时去掉重复 sort –f 排序时忽略大小写 命令替换格式与$()效果相同可以自由选择一种。 WORDS$(grep -o -E [[:alpha:]] filename|sort -u -f)   仅英语词组 WORDSgrep -o -E [[:alnum:]] test4.txt | sort -u -f  包括数字或英文词组 二、for循环 一个文本文件中有大量单词如果需要查找统计这些内容首先想到的应该是用for循环从文件中一个一个读取或打印输出或重定向到文件中。 for循环是按行循环读取的不是按单词读取。我们可以把文本作为一个大的变量容器我们一个一个单词读取如下所示 for word in $(inputfile) do echo $word outfile done echo cat outfile |sort –u –f rm –fr outfile 写成一行代码 for word in $(test4.txt); do echo $word outfile; done;echo cat outfile |sort -u -f;rm-fr outfile 先用$(inputfile)把文件作为一个变量再进行循环。获取单词太多需要重定向到一个文件再排序、去重。中间临时文件可以执行完程序后删除这是一个好习惯 如果不排序、去重for循环查找到的单词是这样的 三、while循环 默认情况下while循环中的read命令是读取整行。因此解决方案可能是读取整行然后使用例如for再获得单词 while read line; do for word in $line; do echoword $word done done filename 与for循环一样前面截图是未排序、去重的。 两个循环获取的单词也是一样多功能相同。 四、awk awk功能强大之处在于利用此命令可以获取一行内容也可以进一步列出行内的单词。可以格式化输出有条件的输出部分或全部。 不排序去重查询输出文本文件的单词 awk {for(i1; iNF; i){print $i}} text_file 排序且去重查询输出文本文件的单词 awk   { for(i1;iNF;i){ count[$i] } } END { for(k in count){ print k } }   test4.txt 写作一行代码 awk {for(i1;iNF;i){words[$i]}}END{for(j in words){print j}} test4.txt 加入内置变量RS的不同值可以获取更详细的单词不再包括单词与标点符号的组合。 小结 在利用bash命令行获取文本文件的所有单词方面应用grep法最简单最快速有重要参考价值。而获取比较理想的效果最好采取awk方法其可以加入多种不同的分隔符用于详细分解由不同标点符号或连接符构成的长串字符。 运用循环方法思路明确但由于分隔符不易设置不能有效得到满意结果。即使利用排序、去重等手段也不能分解如http://www.pili zz.net这样的长字符串。
http://www.zqtcl.cn/news/548260/

相关文章:

  • 泉州网站制作运营商专业北京软件公司招聘信息查询
  • 车床加工东莞网站建设网站建设教学改进
  • 深圳专业做网站建设西安网站建设有限公司
  • wordpress 一键建站wordpress子主题style
  • 昆明设计网站怎么做网络广告
  • 2018什么做网站深圳企业网站设
  • 北京旅游外贸网站建设博客集成wordpress
  • 中国最好的建设网站哪些网站教你做系统
  • 自己做网站别人怎么看见网站建设办公
  • 凡科做网站视频网站哪家好
  • 查询网站是否正规营销策略国内外文献综述
  • 做网页用的网站wordpress用户角色权限管理
  • 怎么查网站备案的公司wordpress 无刷新评论
  • 学前心理学课程建设网站百度极速版下载
  • 佛山做营销型网站建设深圳宝安区租房
  • 做汽车团购的网站建设营销方案有哪些
  • 做设计的网站网络公关什么意思
  • 一般课程网站要怎么做做钓鱼网站软件下载
  • 济南网站建设92jzh收不到wordpress的邮件
  • 一键优化在哪里打开新手怎么入行seo
  • 网站建设的费用明细创建公司网站需要注意什么
  • 微网站怎么做的好宣传片拍摄服务
  • 抚州网站开发机构wordpress开源
  • 企业营销网站建设不属于网页制作工具
  • 呼和浩特网站建设信息建服装类网站需要考虑的因素
  • 百度站长平台工具南京开发app的公司
  • 济南如何挑选网站建设公司设计 网站 现状
  • 网站开发建设流程图wordpress 插件 简码
  • 信宜网站开发公司阿里指数app下载
  • AAP网站开发需要多少钱网站核验通知书