📝 自然语言处理教程
15篇技术文档📅  最后修改于: 2020-11-23 04:36:00        🧑  作者: Mango
语言是一种交流的方法,我们可以说,读和写。自然语言处理(NLP)是计算机科学的一个子领域,涉及人工智能(AI),该技术使计算机能够理解和处理人类语言。本教程旨在使对本学科感兴趣或将其作为课程一部分的毕业生,研究生和研究学生受益。读者可以是初学者或高级学习者。先决条件读者必须具有有关人工智能的基础知识。他/她还应该了解英语语法和Python编程概念中使用的基本术语。...
📅  最后修改于: 2020-11-23 04:36:45        🧑  作者: Mango
语言是一种交流的方法,我们可以说,读和写。例如,我们认为,我们以自然语言来制定决策,计划以及更多。确切地讲。但是,在这个AI时代,我们面临的一个大问题是我们能否以类似的方式与计算机进行通信。换句话说,人类可以用自然语言与计算机进行通信吗?开发NLP应用程序对我们来说是一个挑战,因为计算机需要结构化的数据,但是人类的语音却是非结构化的,而且本质上常常是模棱两可的。从这个意义上讲,我们可以说自然语言处...
📅  最后修改于: 2020-11-23 04:37:32        🧑  作者: Mango
在本章中,我们将学习自然语言处理中的语言资源。语料库语料库是在自然的交流环境中产生的大型结构化的机器可读文本集。它的复数是语料库。它们可以通过不同的方式派生,例如最初是电子文本,口头语言文字和视觉字符识别等。语料库设计要素语言是无限的,但语料库的大小必须是有限的。为了使语料库的大小有限,我们需要采样并按比例包括多种文本类型,以确保良好的语料库设计。现在让我们了解语料库设计的一些重要元素-语料库代表...
📅  最后修改于: 2020-11-23 04:38:29        🧑  作者: Mango
在本章中,我们将了解自然语言处理中的世界级分析。常用表达正则表达式(RE)是一种用于指定文本搜索字符串的语言。 RE帮助我们匹配或查找其他字符串或字符串集,用一个模式举行了专门的语法。正则表达式用于以相同方式在UNIX和MS WORD中搜索文本。我们有使用各种RE功能的各种搜索引擎。正则表达式的属性以下是RE的一些重要属性-美国数学家Stephen Cole Kleene正式化了正则表达式语言。R...
📅  最后修改于: 2020-11-23 04:39:08        🧑  作者: Mango
语法分析或语法分析是NLP的第三阶段。此阶段的目的是绘制确切含义,或者您可以从文本中说出字典含义。语法分析检查文本与形式语法规则相比是否有意义。例如,诸如“热冰淇淋”之类的句子将被语义分析器拒绝。从这个意义上说,句法分析或解析可以定义为分析自然语言中符合形式语法规则的符号字符串的过程。“ parsing”一词的起源来自拉丁语“ pars”,意为“ part”。解析器的概念它用于实现解析任务。它可以...
📅  最后修改于: 2020-11-23 04:39:41        🧑  作者: Mango
语义分析的目的是绘制确切的含义,或者您可以从文本中说出词典的含义。语义分析器的工作是检查文本是否有意义。我们已经知道词法分析也处理单词的含义,那么语义分析与词法分析有何不同?词法分析基于较小的标记,但另一方面,语义分析则侧重于较大的块。这就是为什么语义分析可以分为以下两个部分:学习单词的意思这是语义分析的第一部分,其中对单个单词的含义进行了研究。这一部分称为词汇语义。研究单个单词的组合在第二部分中...
📅  最后修改于: 2020-11-23 04:40:19        🧑  作者: Mango
我们了解到,根据句子中句子的使用情况,词语具有不同的含义。如果我们谈论人类语言,那么它们也是模棱两可的,因为许多单词可以根据其出现的上下文以多种方式进行解释。自然语言处理(NLP)中的词义消歧可以定义为确定通过在特定上下文中使用词来激活词的哪个含义的能力。词汇歧义,句法或语义是任何NLP系统都面临的第一个问题。高度准确的词性(POS)标记器可以解决Word的句法歧义。另一方面,解决语义歧义的问题称...
📅  最后修改于: 2020-11-23 04:41:06        🧑  作者: Mango
AI的最困难问题是通过计算机处理自然语言,换句话说,自然语言处理是人工智能最困难的问题。如果我们谈论自然语言处理中的主要问题,那么自然语言处理中的主要问题之一就是语篇处理-建立有关话语如何粘在一起形成连贯语篇的理论和模型。实际上,语言总是由并置,结构化和连贯的句子组组成,而不是像电影那样孤立且无关的句子。这些连贯的句子组称为语篇。连贯的概念连贯性和话语结构以多种方式相互联系。连贯性以及良好文本的属...
📅  最后修改于: 2020-11-23 04:42:04        🧑  作者: Mango
标记是一种分类,可以定义为对令牌的描述自动分配。在这里,描述符称为标签,它可以表示词性,语义信息等之一。现在,如果我们谈论词性(PoS)标记,则可以将其定义为将词性之一分配给给定单词的过程。通常称为POS标记。用简单的话来说,可以说POS标记是用适当的词性标记句子中的每个词的任务。我们已经知道,词性包括名词,动词,副词,形容词,代词,连词及其子类别。大部分POS标记属于Rule Base POS标...
📅  最后修改于: 2020-11-23 04:42:59        🧑  作者: Mango
在本章中,我们将讨论自然语言处理中的自然语言起始。首先,让我们首先了解什么是自然语言语法。自然语言语法对于语言学而言,语言是一组任意的声音符号。我们可以说语言是有创造力的,受规则支配的,既是天生的又是普遍的。另一方面,它也是人为的。语言的性质因人而异。人们对语言的本质有很多误解。这就是为什么理解歧义术语“语法”的含义非常重要的原因。在语言学中,可以将语法一词定义为借助哪种语言起作用的规则或原则。从...
📅  最后修改于: 2020-11-23 04:44:13        🧑  作者: Mango
信息检索(IR)可以定义为一种软件程序,用于处理,存储,检索和评估来自文档存储库(尤其是文本信息)中的信息。该系统可帮助用户找到他们所需的信息,但不会明确返回问题的答案。它告知可能包含所需信息的文档的存在和位置。满足用户要求的文件称为相关文件。完善的IR系统将仅检索相关文档。借助下图,我们可以了解信息检索(IR)的过程-从上图可以清楚地看出,需要信息的用户将不得不以自然语言的查询形式提出请求。然后...
📅  最后修改于: 2020-11-23 04:44:50        🧑  作者: Mango
自然语言处理(NLP)是一种新兴技术,可衍生出我们当今所见的各种形式的AI,并将其用于创建人与机器之间的无缝以及交互界面将继续是当今和未来的头等大事。越来越多的认知应用。在这里,我们将讨论NLP的一些非常有用的应用程序。机器翻译机器翻译(MT)是将一种源语言或文本翻译成另一种语言的过程,是NLP的最重要应用之一。我们可以通过以下流程图了解机器翻译的过程-机器翻译系统的类型机器翻译系统有不同类型。让...
📅  最后修改于: 2020-11-23 04:45:42        🧑  作者: Mango
在本章中,我们将学习使用Python语言处理。以下功能使Python与其他语言不同-Python被解释了-我们不需要在执行之前编译我们的Python程序,因为解释器会在运行时处理Python 。交互式-我们可以直接与解释器进行交互以编写我们的Python程序。面向对象– Python是在本质上面向对象的,它使这种语言更容易地编写程序,因为与编程它封装对象中代码的这种技术的帮助。初学者可以轻松学习P...
📅  最后修改于: 2020-11-23 04:45:59        🧑  作者: Mango
以下资源包含有关自然语言处理的其他信息。请使用它们来获得有关此方面的更深入的知识。自然语言处理的有用链接自然语言处理Wiki-自然语言处理的Wikipedia参考。关于自然语言处理的实用书籍要在此页面上注册您的网站,请发送电子邮件至...
📅  最后修改于: 2020-11-23 04:46:11        🧑  作者: Mango
语言是一种交流的方法,我们可以说,读和写。自然语言处理(NLP)是计算机科学的一个子领域,涉及人工智能(AI),该技术使计算机能够理解和处理人类语言。...