太原深圳建设工程信息网站,腾讯邮箱注册入口官网,南京华佑千家装饰工程有限公司,如何自己创建一个网址java正则匹配HTML中a标签里的中文字符示例发布于 2020-8-12|复制链接摘记: 本文实例讲述了java正则匹配HTML中a标签里的中文字符。分享给大家供大家参考#xff0c;具体如下#xff1a;今天群里一位朋友问到了一个正则表达式的问题#xff0c;有如下内容#xff1a;xhtml特…java正则匹配HTML中a标签里的中文字符示例发布于 2020-8-12|复制链接摘记: 本文实例讲述了java正则匹配HTML中a标签里的中文字符。分享给大家供大家参考具体如下今天群里一位朋友问到了一个正则表达式的问题有如下内容xhtml特432453543a1特123你 ..本文实例讲述了java正则匹配HTML中a标签里的中文字符。分享给大家供大家参考具体如下今天群里一位朋友问到了一个正则表达式的问题有如下内容xhtml特432453543a1特123你好123吗特2标签中的文字现在要匹配出内容包含中文但标签的属性中不包含comment的标签中的汉字。解决思路如下1、首先匹配出不包括comment的标签2、在匹配结果中进行二次匹配出中文代码如下javapackage com.mmq.regex;import java.util.regex.Matcher;import java.util.regex.Pattern;/*** use 匹配HTML的标签中的中文字符* ProjectName stuff* Author mumaoqiang* FullName com.mmq.regex.MatchChineseCharacters.java* JDK 1.6.0* Version 1.0*/public class MatchChineseCharacters {/*** 根据输入的内容匹配出包含中文但不包含comment的标签中的中文字符* param source 要匹配的内容* return 标签中的中文字符*/public static String matchChineseCharacters(String source) {//匹配出包含中文但不包含comment的标签String reg ([^]*?[\\u4e00-\\u9fa5][^]*?)(?);Pattern pattern Pattern.compile(reg);Matcher matcher pattern.matcher(source);StringBuilder character new StringBuilder();while(matcher.find()){String result matcher.group();System.out.println(result);//对结果进行二次正则匹配出中文字符String reg1 [\\u4e00-\\u9fa5];Pattern p1 Pattern.compile(reg1);Matcher m1 p1.matcher(result);while(m1.find()){character.append(m1.group());}//System.out.println(character.toString());}return character.toString();}public static void main(String[] args) {String result matchChineseCharacters(特432453543a1特123你好123吗特2标签中的文字);System.out.println(result);}}输出结果如下xhtmla1特123你好123吗标签中的文字特你好吗标签中的文字这里做一下解释javaString reg ([^]*?[\\u4e00-\\u9fa5][^]*?)(?);这个匹配内容包含中文但标签的属性中不包含comment的标签的正则中不能使用向后查找?标签中属性不确定所以不能使用[\\u4e00-\\u9fa5]匹配中文字符串而(?)使用向前查找?在结果中不会包含结束标签。这个问题就这样得到解决了。如果说要匹配指定标签中的指定内容那么也是很容易改进的了。若有更好的正则还请留言相互学习。PS这里再为大家提供2款非常方便的正则表达式工具供大家参考使用