📜  搜索引擎如何工作?

📅  最后修改于: 2021-10-21 05:24:32             🧑  作者: Mango

搜索引擎是我们日常生活中不可或缺的一部分。

我们大多数人都熟悉“谷歌” 。如何烤蛋糕?我最喜欢的演员住在哪里?这本书是谁写的?时尚界的最新趋势是什么?我们友好的“谷歌”回答了更多问题。
谷歌是当今可用的众多搜索引擎之一,它在互联网上“挖掘”并为我们提供最相关和最有价值的信息。

现在让我们了解一下,这些搜索引擎是如何工作的?

基本上所有的搜索引擎都会经历三个阶段

  • 爬行
  • 索引
  • 排序和检索

爬行
此阶段涉及扫描站点并获取有关其中包含的所有内容的信息:页面标题、关键字、布局、它链接到的页面——至少是最低限度。

这项任务由称为“蜘蛛”“爬虫”的特殊软件机器人执行。

这些机器人通常从使用最频繁的服务器和流行的网页开始。链接结构对于确定这些“爬虫”遵循的路线非常重要。接下来是新链接以查找许多相互关联的文档,还可以重新访问以前的站点以检查新的更改。一个永无止境的过程。

有时“爬虫”会放弃,如果实际内容被隐藏在主页之外的许多点击。

索引
一旦吸收了所有数据,其中的选定部分将存储在巨大的存储设施中。我们可以这样联系:我们拥有好几本书。遍历所有内容是抓取,并列出它们,连同它们的作者和其他相关信息是索引

这个例子提供了一个小比例的视图。

如果我们将此假设扩展到世界上所有图书馆中包含的书籍,这几乎可以解释搜索引擎承担的重要性。

排序和检索
搜索引擎是答录机。每当我们进行在线搜索时,搜索引擎都会在其数据库中搜索最相关的结果。此外,它还根据网站的受欢迎程度对这些结果进行排名。相关性流行度是这些搜索引擎要提供令人满意的性能要考虑的最重要因素。

不同搜索引擎的排名算法不同。引擎可能会为每个条目分配一个权重,相对于它们在标题、元标记或子标题中的出现。

最基本的算法使用被搜索关键字的频率。然而,这导致了一种叫做“关键字堆砌”的东西,只要它包含关键字,页面就会充满废话。
这让位于基于链接的概念——更受欢迎的网站将被更多地链接。

目前,搜索引擎正在尝试针对自然语言查询进行开发。能够以自由的方式理解我们所说的内容,将真正彻底改变这项技术。今天一个流行的自然语言查询网站是AskJeeves.com ,但它更喜欢简单的查询。时间会产生接受复杂查询的更好的搜索引擎。

网站参考:
http://computer.howstuffworks.com/internet/basics/search-engine.htmhttps://moz.com/beginners-guide-to-seo/how-search-engines-operate