用自然语言解释语言
我们首先定义词典或允许的术语列表。词被分类成词典用户熟悉的词汇类别:名词、代词、表示事物的名称;表示事件的动词;修饰名词的形容词;修饰动词的副词;和函数:冠词(如the)、介词(in)和修饰动词(and)的连词。语言的小词汇如下图所示:
术语 RelPro、Prep 和 Conj 分别代表关系代词、介词和连词。每个类别的概率加起来为 1。
每个类别都以…结尾,表示该类别包含更多术语。即使在理论上,也不可能列出名词、名称、动词、形容词和副词的所有术语。不仅每个班级都有数以万计的会员,而且还在不断推出新会员,例如 iPod 或生物柴油。这五类课程被称为公开课。稍加努力,我们就可以列出代词、关系代词、冠词、介词和连词类别中的所有术语。封闭式课程是那些字数有限(十几个)的课程。封闭式课程演变了数千年而不是数月。例如,“你”和“你”在 17 世纪是常用代词,在 19 世纪下降,现在只在诗歌和一些地方方言中出现。
下一阶段是将单词组合成句子。一个语法为上面的等式显示了六个句法类别中的每一个的规则和每个重写规则的示例。 2 “Every wumpus stinks” 行的解析树如下图所示。根据 E0 的标准,解析树提供了该字符串确实是一个句子的建设性证据。