做网站做网站的公司,wordpress 主题 引入js,网站改了关键词,如何将网站添加到信任站点nltk是NLP领域中一个比较通用的国际分词工具#xff0c;但是使用时往往依赖语料库数据包#xff0c;需要安装到本地#xff0c;以下介绍在线安装和离线安装两种方式#xff1a;
#xff08;ps#xff1a;对NLP感兴趣的朋友可以相互学习#xff0c;我的微信号#xff1…nltk是NLP领域中一个比较通用的国际分词工具但是使用时往往依赖语料库数据包需要安装到本地以下介绍在线安装和离线安装两种方式
ps对NLP感兴趣的朋友可以相互学习我的微信号Joney-Joney请备注NLP博客 1.在线安装punkt等数据包:
1.1 在线安装时往往会报SSL等安全连接验证错误可通过python的ssl模块中启用无验证的网络连接方式代码如下
import nltk
import ssl
try:_create_unverified_https_context ssl._create_unverified_context
except AttributeError:pass
else:ssl._create_default_https_context _create_unverified_https_context
nltk.download()
1.2 运行后就会弹出python解释器后自动打开nltk下载器的界面如下按图示操作即可 1.3 单个包都比较小下载完后打开上图中自行指定的nltk_data目录可看到punkt目录结构如下 1.4 恭喜您现在可以正确运行你的代码啦报错日志中依赖什么包就安装对应的包 2 离线安装方式
2.1 先到官网NLTK Corpora如下图下载zip包 2.2 新建一个nltk_data文件夹仅第一次安装时放到任意路径下如我放在Python.framework/Versions/3.7/share/中
2.3 把下载好的语料包punkt.zip解压到nltk_data/tokenizers/中因为punkt属于tokenizers所以需要新建tokenizers文件夹
2.4 最后把nltk_data目录以代码的形式添加到nltk的数据文件路径中只需要在第一次安装时添加添加的代码如下。
import nltk
nltk.data.path.append(xxxx/nltk_data) # 参数为你放置的nltk_data文件夹的绝对路径 3.安装nltk其它的语料库同理个人推荐在线安装的方式比较方便~~