nltk库安装及模型国内网络下载安装

nltk找不到nltk_data

NLTK是一个相等流行的自然语言处理工具包,它是一个python工具包,为我们处理人类自然语言数据提供了丰富的函数和接口,常用于文本处理、标记、分析和语言建模。

nltk的包安装也是非常简单,我们只需要:

pip install nltk

如果你因为再国内无法连接到官网的话,可以采用镜像源安装的方式,以清华大学的镜像源安装为例:

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple nltk

安装完成后我们可以试着写一个简单的小例子来测试,代码如下:

import nltk
from nltk import FreqDist
from nltk.corpus import reuters

# 从reuters语料库中获取单词列表
words = reuters.words()

# 创建词频统计
fdist = FreqDist(words)

# 输出前20个最常见的词和它们的词频
print(fdist.most_common(20))

然后你运行的话,可能会出现如下错误:

nltk找不到nltk_data

这个错误的原因是因为你虽然安装了nltk这个库,但是却没有安装它的模型、资源和插件之类的,导致调用的时候出现错误。解决的办法也很简单,执行如下代码可以打开下载器:

import nltk

# 下载reuters语料库
nltk.download()

执行后会打开如下窗口:

nltk下载模型和语料库

什么?你打开是空白的?下载不了?下载不了就对了,因为我也打不开,国内的网络无法访问到官方服务器进行下载,所以我们要换一种方法进行下载,为了方便小朋友们使用,我已经把打包好的资源包nltk_data.zip放到云盘了,欢迎下载使用。

来源:诚通网盘

下载完以后,解压后复制到上面报错的任何一个目录里,一般是放在当前登录账号的目录,这在windows、mac、linux里通用,在windows下,你还可以放到任何一个盘符的根目录下,如图:

nltk资源包放置位置

资源包放置完以后,我们再执行上面的代码:

nltk开发案例代码

你会发现结果出来了!

 

版权声明:
作者:崔圣杰
链接:https://www.cuishengjie.com/983.html
来源:论剑阁-崔圣杰博客
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
打赏
海报
nltk库安装及模型国内网络下载安装
NLTK是一个相等流行的自然语言处理工具包,它是一个python工具包,为我们处理人类自然语言数据提供了丰富的函数和接口,常用于文本处理、标记、分析和语言建模。 nltk的包安装也是非常简单,我们只需要: pip install nltk 如果你因为再国内无法连接到官网的话,可以采用镜像源安装的方式,以清华大学的镜像源安装为例: pip install -i https://pypi.tuna.tsinghua.edu.cn/simple nltk
<<上一篇
下一篇>>
文章目录
关闭
目 录