当前位置: 首页 > news >正文

聊城做网站的公司效果公益主机

聊城做网站的公司效果,公益主机,合肥市芜湖官网设计,重庆招商网文章目录 1. 写在前面2. 页面分析3. 字符知识4. 加密分析 【作者主页】#xff1a;吴秋霖 【作者介绍】#xff1a;Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力于Python与爬虫领域研究与开发工作#xff01; 【作者推荐】#xff1a;对JS逆向感兴趣的朋… 文章目录 1. 写在前面2. 页面分析3. 字符知识4. 加密分析 【作者主页】吴秋霖 【作者介绍】Python领域优质创作者、阿里云博客专家、华为云享专家。长期致力于Python与爬虫领域研究与开发工作 【作者推荐】对JS逆向感兴趣的朋友可以关注《爬虫JS逆向实战》对分布式爬虫平台感兴趣的朋友可以关注《分布式爬虫平台搭建与开发实战》 还有未来会持续更新的验证码突防、APP逆向、Python领域等一系列文章 1. 写在前面 目前市面上有不少的网站使用了字体加密技术像一些重要的数字内容使用字体加密很常见从早期的静态固定字体文件随着不断的对抗演进到目前的动态字体文件从PC端的应用到目前APP页面的普及使用 本期文字将以红色小番茄为例咱们使用OCR识别技术来攻克一下字体加密 2. 页面分析 我们打开首先网站分析一下可以看到响应的HTML内容中网页显示的本文内容均是看起来晦涩难懂的字符这就是字体加密。如下所示 对于Web端的字体加密我们可能都知道会有相应的woff类型的文件存储着自定义的字体它的作用则是让网站能够使用这些自定义的字体来显示加密的文本内容如下所示 3. 字符知识 在真正的内容分析开始之前我们需要了解的一些知识点。这里不知道的朋友认真学所有的中文汉字它都自己对应的一串数字码也叫做Unicode码点这是一种国际化的字符编码标准为世界上几乎所有的字符集提供了一个唯一的标识 它们是一个非负整数如下作者随机打印了几个示例 同理我们使用Python的内置函数ord可以查看字符的码点chr函数则将码点转换为字符 4. 加密分析 接下来这里将网页中加密的文本拿一小段下来简单的进行一个测试。使用ord打印一下所有字符的码点可以看到一个特征就是每一个被加密的字体对应的码点都是58…这样的如下所示 这个时候我们则需要将上面提到的woff文件下载下来并使用fontTools库来加载字体并解析其结构代码如下 from fontTools.ttLib import TTFonturl https://lf6-awef.bytetos.com/obj/awesome-font/c/dc027189e0ba4cd-700.woff2response requests.get(url).content with TTFont(BytesIO(response)) as font_parse:u_d font_parse.getBestCmap())将会得到一个码点与字体编码对应的字典如下所示 {58344: gid58344, 58345: gid58345, 58346: gid58346, 58347: gid58347, 58348: gid58348, 58349: gid58349, 58350: gid58350, 58351: gid58351, 58352: gid58352}接下来我们需要将gid编码对应的文字信息拿到并建立字典。方便我们后续在对文本内容进行还原的时候调用加密字体编码如何对应明文数据代码实现如下 unicode_reuslt [] for key, _ in u_d.items():unicode_reuslt.append(key) char_list [chr(ch_unicode) for ch_unicode in unicode_reuslt] normal_dict, error_dict font_to_img(char_list, ttf_name) new_dict {ord(key): value for key, value in normal_dict.items()} print(new_dict)在这里将使用到OCR识别技术去还原加密字体的文字这也是当前比较主流的一种方案代码实现如下所示 def font_to_img(code_list, filename, score0.95):normal_dict {}ocr CnOcr()for char_list in code_list:char_code char_list.encode().decode()img_size 1024img Image.new(img, (img_size, img_size), 255)draw ImageDraw.Draw(img)font ImageFont.truetype(filename, int(img_size * 0.7))x, y draw.textsize(char_code, fontfont)draw.text(((img_size - x) // 2, (img_size - y) // 2), char_code, fontfont, fill0)img img.convert(RGB)word ocr.ocr_for_single_line(np.array(img))normal_dict[char_code] word[text]return normal_dict如上代码这里简单解读一下score参数表示OCR对该文本的识别得分上面代码中没有使用的原因是有较小概率的丢失率这个问题可以找一些更精准的模型来识别 再说说识别文字的流程与原理上面使用Image来创建了一个白色的背景图像然后使用ImageDraw在图像上绘制出字符字体大小为图像大小的70% 然后将图像转换为RGB格式最后使用Ocr对图像进行单行识别获取识别结果以及识别得分结果如下所示 接下来我门需要做的就是对加密的文本内容进行遍历对每一个字符进行编码转换得到对对应的码点提取码点为58特征的加密字体然后从上面字典获取对应的文字如下所示 最终我们再通过上述的代码将加密打散还原出来的加密字体文字拼接成完整的句子。这里的话我们将所有加密特征与非加密文字内容完成组装即可最终内容还原如下所示 以上是加密字体文字内容还原的全部流程如需要完整的Python代码进行测试或学习可联系作者获取 好了到这里又到了跟大家说再见的时候了。创作不易帮忙点个赞再走吧。你的支持是我创作的动力希望能带给大家更多优质的文章
http://www.zqtcl.cn/news/864434/

相关文章:

  • 房产网站建设方案项目书传到网站根目录
  • 页面设计网站素材制作个人网站
  • 怎么制作免费建网站cnzz wordpress
  • 网站界面技术方案wordpress开启子目录多站点模式
  • 汕头网站建设推广价格筑龙网官网首页
  • 河北省建设执业资格注册中心网站东莞微网站建设多少钱
  • 企业网站建设功能模块discover wordpress
  • 网站建设结课做诱导网站
  • 网站开发与设计难嘛青州网站建设推广
  • 网站开发程序员工资谷歌推广网站建设
  • 江门网页建站模板金富通青岛建设工程有限公司网站
  • 网站后台账户如何做会计分录做传奇开服一条龙网站哪个好
  • 天门市网站建设seo平台建设网站公司
  • php网站怎么做302织梦网站有会员系统怎么做
  • 清远建设局网站安阳吧百度贴吧
  • 做什么软件做网站效率最好网站公司建设都招聘那些职位
  • 缙云建设局网站深圳营销型网站设计
  • 企业网站制作价格成都高端网站建设公司哪家好
  • wordpress+做仿站网站建设费用属于业务宣传费吗
  • 昆明企业网站制作wordpress移动端插件menu
  • 长沙网站设计培训学校南宁建设网站哪里好
  • 提高基层治理效能全国seo搜索排名优化公司
  • 如何建设网站简介WordPress集成tipask
  • 青海网站开发公司建筑公司的愿景怎么写
  • 建设银行集团网站首页优化科技
  • dede 汽车网站网站上的彩票走势图是怎么做的
  • 网站内容营销呼市推广网站
  • 南宁网站建设价格医院有关页面设计模板
  • 城乡住房和城乡建设厅网站湖州公司网站建设
  • h5响应式的网站建站空间哪个好