wordpress版 影视站,校园网站建设的重要性,便民网站开发,联通官网视频中讲解的是百度翻译#xff0c;但是视频中的方法现在已经不适用了#xff0c;因为他们对 URL 的参数进行了修改#xff0c;导致没法直接修改参数来爬取对应的翻译结果#xff0c;这里我使用搜狗翻译来做演示#xff0c;原理是一样的。 我们搜索的关键字会返回在 URL 中… 视频中讲解的是百度翻译但是视频中的方法现在已经不适用了因为他们对 URL 的参数进行了修改导致没法直接修改参数来爬取对应的翻译结果这里我使用搜狗翻译来做演示原理是一样的。 我们搜索的关键字会返回在 URL 中后面的无用参数可以删除 删除后 前置知识
翻译相关的页面有个特点就是你输入单词后不需要其他操作页面会自动刷新出新的数据该数据就是翻译结构
【页面局部刷新的现象】 如下图所示就是请求回来的翻译结果 所以该数据包就是我们需要捕获的数据包 判断返回数据类型是否为 json 编写代码
import requests
import jsonif __name__ __main__:post_url https://fanyi.sogou.com/reventondc/suggV3headers {User-Agent:Mozilla/5.0 (Windows NT 10.0; Win64; x64; rv:123.0) Gecko/20100101 Firefox/123.0}word input(enter a word:)data {from:auto,to:zh-CHS,client:web,text:word,uuid:5c2d6117-a5e9-482e-abaf-2343abcf3a93,pid:sogou-dict-vr,addSugg:on}response requests.post(urlpost_url,datadata,headersheaders)# json 返回的是一个对象如果确认响应数据是json类型的才可以使用dic_obj response.json()print(dic_obj)file_name word .jsonfp open(file_name,w,encodingutf-8)json.dump(dic_obj,fpfp,ensure_asciiFalse) 注意
data 字典里的请求参数要补全不然无法实现