📜  自然语言处理-初始

📅  最后修改于: 2020-11-23 04:42:59             🧑  作者: Mango


在本章中,我们将讨论自然语言处理中的自然语言起始。首先,让我们首先了解什么是自然语言语法。

自然语言语法

对于语言学而言,语言是一组任意的声音符号。我们可以说语言是有创造力的,受规则支配的,既是天生的又是普遍的。另一方面,它也是人为的。语言的性质因人而异。人们对语言的本质有很多误解。这就是为什么理解歧义术语“语法”的含义非常重要的原因。在语言学中,可以将语法一词定义为借助哪种语言起作用的规则或原则。从广义上讲,我们可以将语法分为两类:

描述语法

语言学家和语法学家用来阐述说话者语法的规则集称为描述性语法。

透视语法

这是一种非常不同的语法含义,它试图维持语言的正确性标准。此类别与语言的实际工作方式无关。

语言组成

研究语言分为相互关联的组成部分,这些组成部分是常规的以及语言研究的任意划分。这些组件的解释如下-

音系学

语言的第一个组成部分是语音。它是对特定语言的语音的研究。这个词的起源可以追溯到希腊语,其中“电话”是指声音或语音。语音学是语音学的一个分支,它是从人类语音的产生,感知或物理特性的角度研究人类的语音。 IPA(国际语音字母)是一种在学习语音学时以常规方式表示人类声音的工具。在IPA中,每个书面符号仅代表一个语音,反之亦然。

音素

它可以定义为一种语言中将一个单词与另一个单词区分开的声音单位之一。在语言中,音素写在斜线之间。例如,音素/ k /出现在kit,skit之类的词中。

形态学

它是语言的第二部分。它是对特定语言中单词的结构和分类的研究。这个词的起源是希腊语,其中“ morphe”表示“ form”。形态学考虑了语言中单词形成的原理。换句话说,声音如何组合成有意义的单元,例如前缀,后缀和词根。它还考虑了如何将单词分组为词性。

勒克美

在语言学中,与单个单词所采用的一组形式相对应的形态学分析的抽象单位称为词素。词素在句子中的使用方式由其语法类别决定。 Lexeme可以是单个单词或多单词。例如,单词talk是单个单词词素的示例,该单词可能有许多语法变体,如talks,talked和talking。多字词素可以由多个正交字组成。例如,大声说,直通等是多词词素的示例。

句法

它是语言的第三部分。这是将单词分解为较大单位的顺序和排列的研究。这个词可以追溯到希腊语,其中suntassein的意思是“整理”。它研究句子的类型及其结构,从句和短语。

语义学

它是语言的第四部分。这是对意义如何传达的研究。含义可能与外界有关,也可能与句子的语法有关。该词可以追溯到希腊语,其中semainein的意思是“表示”,“显示”,“信号”。

语用学

它是语言的第五部分。它是对语言功能及其在上下文中的使用的研究。这个词的起源可以追溯到希腊语,其中“ pragma”一词的意思是“行为”,“事理”。

语法类别

语法类别可以定义为语言语法内的单元或特征类。这些单元是语言的基础,并具有一组共同的特征。语法类别也称为语法特征。

语法类别的清单如下所述-

这是最简单的语法类别。我们有两个与此类别相关的术语-单数和复数。单数是“一个”的概念,而复数是“一个以上”的概念。例如,这只狗。

性别

语法性别通过人称代词和第三人称的不同来表达。语法性别的例子很单一-他,她,它;第一人称和第二人称-我,我们和你;他们的第三人称复数形式是普通性别或中性性别。

另一个简单的语法类别是人。在此基础上,以下三个术语被识别-

  • 第一人称-说话的人被认为是第一人称。

  • 第二人称–听众或与之交谈的人被视为第二人称。

  • 第三人称-我们正在谈论的人或事物被视为第三人称。

案件

它是最困难的语法类别之一。它可以被定义为一个名词短语(NP)或名词短语的一个动词或句子中的其他名词短语的关系的函数的指示。我们有以下三种情况以人称和疑问代词表达-

  • 主格-它是主体的函数。例如,我,我们,您,他,她,它,他们以及谁都是主观的。

  • 属格-这是拥有者的函数。例如,我/我的,我们/我们的,他/她/她的,其/他们的他们的属属。

  • 客观案例-这是对象的函数。例如,客观的我,我们,您,他,她,他们。

此语法类别与形容词和副词有关。它具有以下三个术语-

  • 正度-表示品质。例如,大,快,美都是正度。

  • 比较度-在两个项目之一中表示较高的质量度或强度。例如,比较度更大,更快,更漂亮。

  • 最高级-表示三个或多个项目之一中质量的最大程度或最高强度。例如,最大,最快,最美丽是最高级。

确定性和不确定性

这两个概念都很简单。我们所知道的确定性代表了指称对象,它是说话者或听众已知,熟悉或可识别的。另一方面,不确定性表示未知或不熟悉的对象。该概念可以通过名词与名词同时出现来理解-

  • 定冠词

  • 不定冠词-a / an

紧张

此语法类别与动词相关,可以定义为动作时间的语言指示。时态建立关系,因为它表示事件的时间与讲话时间的关系。大致来说,它是以下三种类型-

  • 现在时-表示当前时刻动作的发生。例如,Ram努力工作。

  • 过去时-表示当前时刻之前动作的发生。例如,下雨了。

  • 将来时-表示当前时刻之后动作的发生。例如,会下雨。

方面

该语法类别可以被定义为事件的观点。它可以是以下类型-

  • 完美方面-观点在方面是完整的和完整的。例如,像昨天我遇到我的朋友这样简单的过去时态在英语方面是完美的,因为它将事件视为完整和整体。

  • 不完美的方面-观点被认为是该方面的进行中的和不完整的。例如,我现在正在处理这个问题的现在分词时态在英语方面是不完美的,因为它将事件视为不完整且正在进行中。

心情

这个语法类别很难定义,但可以简单地表述为说话者对他/她正在谈论的内容的态度的指示。它也是动词的语法特征。它与语法时态和语法方面不同。情绪的例子是指示性的,疑问的,命令性的,禁令的,虚拟的,潜在的,选择的,动名词和分词。

协议

也称为和解。当一个单词从依赖于它所涉及的其他单词改变而发生时。换句话说,它涉及使某些语法类别的值在不同的单词或词性之间达成一致。以下是基于其他语法类别的协议-

  • 基于人的协议-它是主语和动词之间的协议。例如,我们始终使用“我是”和“他是”,但从未使用“他是”和“我是”。

  • 基于数字的协议-此协议介于主语和动词之间。在这种情况下,第一人称单数,第二人称复数等都有特定的动词形式。例如,第一人称单数:我确实是,第二人称复数:我们确实是,第三人称单数:男孩是唱歌,第三人称复数:男孩是唱歌。

  • 基于性别的协议-在英语中,代词和先行词之间存在性别协议。例如,他到达了目的地。船到达了她的目的地。

  • 基于案例的协议-这种协议不是英语的重要功能。例如,谁先来-他还是他的妹妹?

口语语法

书面英语和口语英语语法具有许多共同的特征,但与此同时,它们在许多方面也有所不同。以下功能区分了口语和书面英语语法-

漏气和维修

这种引人注目的功能使英语的口语和书面语法互不相同。它被单独称为“流淌现象”,被统称为修复现象。不满之处包括以下使用-

  • 填充词-有时在句子之间,我们使用一些填充词。它们被称为填充暂停的填充。这样的单词的示例是uh和um。

  • Reparandum and repair-句子之间单词的重复片段称为reparandum。在同一段中,更改的单词称为修复。考虑以下示例以了解这一点-

ABC航空公司是否提供任何单程航班,单程票价为5000卢比?

在以上句子中,单程飞行是一种保留,单程飞行是一种修复。

重新启动

填充器暂停后,将重新启动。例如,在上面的句子中,当说话者开始询问单程航班然后停止时,通过加油机暂停纠正自己,然后重新询问单程票价,则重新启动发生。

词片段

有时我们用较小的单词片段讲句子。例如,什么时间?这里的单词w-wha是单词片段。