📜  Google 搜索的工作原理!!

📅  最后修改于: 2021-10-19 08:30:53             🧑  作者: Mango

谷歌搜索:每天眨眼间就会发生数十亿次,我们可以拥有任何我们能想到的东西!

GFG

让我们探索使之成为可能的艺术和科学。

爬行和索引:在我们输入搜索之前,查询的旅程就开始了,爬行和索引数万亿个文档的网络。

Google 使用称为 Web Crawler 的软件来发现公开可用的网页。最著名的爬虫称为Googlebot 。爬虫查看网页并跟踪这些网页上的链接,从一个链接到另一个链接,并将有关这些网页的数据带回 Google 的服务器。

网络就像一个不断增长的公共图书馆,拥有数十亿本书。谷歌本质上是在抓取过程中收集页面,然后创建一个索引,就像书后面的索引一样。 Google 索引包括有关单词及其位置的信息。当我们搜索时,在最基本的层面上,他们的算法会在索引中查找我们的搜索词以找到合适的页面。

算法:算法是计算机处理和公式,它们接受我们的查询并从包含有用信息的数千个网页中解决它们。 Google 使用由其创始人 Sergey Brin 和 Larry Page 开发的 PageRank 算法。今天,谷歌的算法依赖于 200 多个独特的信号,其中包括网站上的术语、内容的新鲜度和我们的地区,这些信息使人们可以猜测我们可能真正在寻找什么。

打击垃圾邮件:垃圾邮件网站试图通过反复重复关键字、购买通过 PageRank 的链接或在屏幕上放置不可见文本等技术,将其置于搜索结果的顶部。这对搜索不利,因为相关网站被掩埋,对合法网站所有者不利,因为他们的网站变得更难找到。好消息是 Google 的算法可以检测到绝大多数垃圾邮件并自动将其降级。
这是谷歌搜索旅行的一瞥

相关文章:

  • 谷歌排名如何运作?
  • Facebook 如何为您搜索的内容展示广告
  • 搜索引擎优化 (SEO) |基本
  • 谷歌如何自我更新

重要链接:

  1. https://www.google.com/insidesearch/howsearchworks/thestory/
  2. http://infolab.stanford.edu/~backrub/google.html(谷歌创始人的 Pagerank 论文)