📜  搜索引擎

📅  最后修改于: 2020-12-14 06:09:42             🧑  作者: Mango


介绍

搜索引擎是指庞大的Internet资源数据库,例如网页,新闻组,程序,图像等。它有助于在Internet上定位信息。

用户可以通过以关键字或短语形式传递查询来搜索任何信息。然后,它在其数据库中搜索相关信息并返回给用户。

internet_technologies_tutorial

搜索引擎组件

通常,搜索引擎包含以下三个基本组成部分:

  1. 网络爬虫

  2. 数据库

  3. 搜索界面

网络爬虫

它也被称为蜘蛛机器人。它是遍历网络以收集信息的软件组件。

数据库

Web上的所有信息都存储在数据库中。它由庞大的Web资源组成。

搜索界面

该组件是用户和数据库之间的接口。它可以帮助用户搜索数据库。

搜索引擎工作

Web搜寻器,数据库和搜索界面是搜索引擎的主要组成部分,实际上使搜索引擎能够正常工作。搜索引擎使用布尔表达式AND,OR或NOT限制和扩展搜索结果。以下是搜索引擎执行的步骤:

  • 搜索引擎在预定义数据库的索引中查找关键字,而不是直接进入Web来搜索关键字。

  • 然后,它使用软件在数据库中搜索信息。该软件组件称为网络搜寻器。

  • Web搜寻器找到页面后,搜索引擎就会显示相关的网页。这些检索到的网页通常包括页面标题,文本部分的大小,前几个句子等。

这些搜索条件可能因一个搜索引擎而异。根据各种因素对检索到的信息进行排名,例如关键字的频率,信息的相关性,链接等。

  • 用户可以单击任何搜索结果以将其打开。

建筑

搜索引擎架构包括以下三个基本层:

  • 内容收集和完善。

  • 搜索核心

  • 用户和应用程序界面

internet_technologies_tutorial

搜索引擎处理

索引过程

索引编制过程包括以下三个任务:

  • 文字获取

  • 文字转换

  • 索引创建

文字获取

它标识并存储用于索引的文档。

文字转换

它将文档转换为索引术语或特征。

索引创建

它采用由文本转换创建的索引词并创建数据结构以支持快速搜索。

查询流程

查询过程包括以下三个任务:

  • 用户互动

  • 排行

  • 评价

用户互动

它支持创建和完善用户查询并显示结果。

排行

它使用查询和索引来创建文档的排名列表。

评价

它监视和衡量有效性和效率。它是脱机完成的。

例子

以下是当今可用的几种搜索引擎:

Search Engine Description
Google It was originally called BackRub. It is the most popular search engine globally.
Bing It was launched in 2009 by Microsoft. It is the latest web-based search engine that also delivers Yahoo’s results.
Ask It was launched in 1996 and was originally known as Ask Jeeves. It includes support for match, dictionary, and conversation question.
AltaVista It was launched by Digital Equipment Corporation in 1995. Since 2003, it is powered by Yahoo technology.
AOL.Search It is powered by Google.
LYCOS It is top 5 internet portal and 13th largest online property according to Media Matrix.
Alexa It is subsidiary of Amazon and used for providing website traffic information.