📜  自然语言工具包-入门

📅  最后修改于: 2020-10-14 09:07:36             🧑  作者: Mango


为了安装NLTK,我们必须在计算机上安装Python 。您可以转到链接www。 Python.org / downloads,然后为您的操作系统选择最新版本,例如Windows,Mac和Linux / Unix。有关Python的基本教程,请参考链接www.tutorialspoint.com/python3/index.htm

安装自然语言工具包

现在,在计算机系统上安装Python,让我们了解如何安装NLTK。

安装NLTK

我们可以按以下方式在各种操作系统上安装NLTK-

在Windows上

为了在Windows OS上安装NLTK,请遵循以下步骤-

  • 首先,打开Windows命令提示符并导航到pip文件夹的位置。

  • 接下来,输入以下命令以安装NLTK-

pip3 install nltk

现在,从Windows开始菜单中打开PythonShell并键入以下命令,以验证NLTK的安装-

Import nltk

如果没有错误,则说明您已在具有Python3的Windows操作系统上成功安装了NLTK。

在Mac / Linux上

为了在Mac / Linux OS上安装NLTK,请编写以下命令-

sudo pip install -U nltk

如果您的计算机上未安装pip,请按照以下说明首先安装pip-

首先,使用以下命令通过以下方式更新包索引:

sudo apt update

现在,键入以下命令为Python 3安装pip-

sudo apt install python3-pip

通过水蟒

为了通过Anaconda安装NLTK,请遵循以下步骤-

首先,要安装Anaconda,请转到链接www.anaconda.com/distribution/#download-section ,然后选择您需要安装的Python版本。

水蟒

在计算机系统上安装Anaconda后,请转到其命令提示符并编写以下命令-

conda install -c anaconda nltk

水蟒指挥部

您需要检查输出并输入“是”。 NLTK将被下载并安装在您的Anaconda软件包中。

下载NLTK的数据集和软件包

现在我们已经在计算机上安装了NLTK,但是要使用它,我们需要下载其中可用的数据集(语料库)。可用的一些重要数据集有stpwords,guntenberg,framenet_v15等。

借助以下命令,我们可以下载所有NLTK数据集-

import nltk
nltk.download()

自然语言工具包数据集

您将获得以下NLTK下载窗口。

自然语言工具包下载

现在,单击下载按钮以下载数据集。

如何运行NLTK脚本?

以下是使用PorterStemmer nltk类实现Porter Stemmer算法的示例。通过此示例,您将能够了解如何运行NLTK脚本。

首先,我们需要导入自然语言工具包(nltk)。

import nltk

现在,导入PorterStemmer类以实现Porter Stemmer算法。

from nltk.stem import PorterStemmer

接下来,如下创建Porter Stemmer类的实例-

word_stemmer = PorterStemmer()

现在,输入您要阻止的单词。 –

word_stemmer.stem('writing')

输出

'write'
word_stemmer.stem('eating')

输出

'eat'