📝 自然语言工具包NLTK教程

21篇技术文档
  分块和信息提取

📅  最后修改于: 2020-10-14 09:26:05        🧑  作者: Mango

什么是块?分块是自然语言处理中的重要过程之一,用于识别词性(POS)和短短语。换句话说,通过分块,我们可以获得句子的结构。也称为部分解析。块状和花纹块模式是词性(POS)标签的模式,它定义了组成词块的单词类型。我们可以借助修改后的正则表达式定义块模式。此外,我们还可以定义什么样的话不应该是一大块这些unchunked词被称为裂口模式。实施实例在下面的示例中,连同解析句子“这本书有很多章”的结果,还...

  自然语言工具包-转换块

📅  最后修改于: 2020-10-14 09:27:09        🧑  作者: Mango

为什么要转换块?到目前为止,我们已经从句子中获得了大块或短语,但是我们应该如何处理它们。重要的任务之一是对其进行转换。但为什么?它要做以下事情-语法更正和重新排列短语过滤不重要/无用的单词假设如果您要判断短语的含义,那么有很多常用的单词,例如’the’,’a’都是无关紧要的或无用的。例如,请参见以下短语-“电影很好”。这里最重要的词是“电影”和“好”。换句话说,“ the”和“ was”都是无用的...

  自然语言工具包-转换树

📅  最后修改于: 2020-10-14 09:28:05        🧑  作者: Mango

以下是转换树的两个原因-修改深度解析树并展平深解析树将树或子树转换为句子我们将在这里讨论的第一个方法是将Tree或subtree转换回句子或大块字符串。这非常简单,让我们在以下示例中进行查看-例输出深树展平嵌套短语的深树不能用于训练块,因此我们必须在使用前将其扁平化。在下面的示例中,我们将使用第3个经过解析的句子,它是来自树库语料库的嵌套短语的深树。例为了实现这一点,我们定义了一个名为deeptr...

  自然语言工具包-文本分类

📅  最后修改于: 2020-10-14 09:29:37        🧑  作者: Mango

什么是文字分类?顾名思义,文本分类是对文本或文档进行分类的方法。但是这里出现了一个问题,为什么我们需要使用文本分类器?一旦检查了文档或一段文本中的单词用法,分类器将能够决定应为其分配什么类别标签。二进制分类器顾名思义,二进制分类器将在两个标签之间决定。例如,正面或负面。在这种情况下,文本或文档可以是一个标签,也可以是另一个标签,但不能同时是两者。多标签分类器与二进制分类器相反,多标签分类器可以将一...

  自然语言工具包-有用的资源

📅  最后修改于: 2020-10-14 09:30:18        🧑  作者: Mango

以下资源包含有关自然语言工具包的其他信息。请使用它们来获得有关此方面的更深入的知识。自然语言工具包的有用链接自然语言工具包–自然语言工具包的官方网站。自然语言工具包@ Wikipedia-NLTK,其历史和其他各种术语已用简单的语言进行了解释。关于自然语言工具包的有用书籍要在此页面上注册您的网站,请发送电子邮件至...

  讨论自然语言工具包

📅  最后修改于: 2020-10-14 09:30:54        🧑  作者: Mango

语言是一种交流的方法,我们可以说,读和写。自然语言处理(NLP)是计算机科学尤其是人工智能(AI)的子领域,它关注使计算机能够理解和处理人类语言。我们有各种开源的NLP工具,但在易用性和概念解释方面,NLTK(自然语言工具包)得分很高。 Python的学习曲线非常快,并且NLTK是用Python编写的,因此NLTK也具有很好的学习工具。 NLTK已合并了大多数任务,例如标记化,词干,词法化,标点,...