📜  倒排指数和远期指数的区别

📅  最后修改于: 2021-10-27 16:54:07             🧑  作者: Mango

倒排索引

  1. 它是一种数据结构,用于存储从单词到文档或文档集的映射,即指导您从单词到文档。
  2. 建立倒排索引的步骤是:
    • 获取文档并收集所有单词。
    • 检查每个单词,如果存在,则将文档的引用添加到索引,否则在索引中为该单词创建新条目。
    • 对所有文档重复上述步骤并对单词进行排序。
  3. 索引很慢,因为它首先检查单词是否存在。
  4. 搜索速度非常快。
  5. 倒排索引示例:
    Word                              Documents
    hello                             doc1      
    sky                               doc1, doc3
    coffee                            doc2
    hi                                doc2
    greetings                         doc3                               
    

    它不会在索引中存储重复的关键字。

  6. 倒排索引的真实例子:
    • 书后附索引。
    • 反向查找

远期指数:

  1. 它是一种存储从文档到单词的映射的数据结构,即指导您从文档到单词。
  2. 建立正向索引的步骤是:
    • 获取文档并收集所有关键字。
    • 在此文档的索引条目中附加所有关键字。
    • 对所有文档重复上述步骤
  3. 索引非常快,因为它只在向前移动时附加关键字。
  4. 搜索非常困难,因为它必须查看索引的每个内容才能检索与单词相关的所有页面。
  5. 前向索引示例:
    Document                          Keywords
    doc1                              hello, sky, morning      
    doc2                              tea, coffee, hi
    doc3                              greetings, sky
    

    它将重复的关键字存储在索引中。例如:单词“sky”被存储多次。

  6. 远期指数的现实生活示例:
    • 书中的目录。
    • DNS查询

正向指数和反向指数的相似之处:

  • 两者都用于搜索文档或文档集中的文本。

如果您希望与专家一起参加现场课程,请参阅DSA 现场工作专业课程学生竞争性编程现场课程。