倒排索引
- 它是一种数据结构,用于存储从单词到文档或文档集的映射,即指导您从单词到文档。
- 建立倒排索引的步骤是:
- 获取文档并收集所有单词。
- 检查每个单词,如果存在,则将文档的引用添加到索引,否则在索引中为该单词创建新条目。
- 对所有文档重复上述步骤并对单词进行排序。
- 索引很慢,因为它首先检查单词是否存在。
- 搜索速度非常快。
- 倒排索引示例:
Word Documents hello doc1 sky doc1, doc3 coffee doc2 hi doc2 greetings doc3
它不会在索引中存储重复的关键字。
- 倒排索引的真实例子:
- 书后附索引。
- 反向查找
远期指数:
- 它是一种存储从文档到单词的映射的数据结构,即指导您从文档到单词。
- 建立正向索引的步骤是:
- 获取文档并收集所有关键字。
- 在此文档的索引条目中附加所有关键字。
- 对所有文档重复上述步骤
- 索引非常快,因为它只在向前移动时附加关键字。
- 搜索非常困难,因为它必须查看索引的每个内容才能检索与单词相关的所有页面。
- 前向索引示例:
Document Keywords doc1 hello, sky, morning doc2 tea, coffee, hi doc3 greetings, sky
它将重复的关键字存储在索引中。例如:单词“sky”被存储多次。
- 远期指数的现实生活示例:
- 书中的目录。
- DNS查询
正向指数和反向指数的相似之处:
- 两者都用于搜索文档或文档集中的文本。
如果您希望与专家一起参加现场课程,请参阅DSA 现场工作专业课程和学生竞争性编程现场课程。