📅  最后修改于: 2020-12-14 06:09:42             🧑  作者: Mango
搜索引擎是指庞大的Internet资源数据库,例如网页,新闻组,程序,图像等。它有助于在Internet上定位信息。
用户可以通过以关键字或短语形式传递查询来搜索任何信息。然后,它在其数据库中搜索相关信息并返回给用户。
通常,搜索引擎包含以下三个基本组成部分:
网络爬虫
数据库
搜索界面
它也被称为蜘蛛或机器人。它是遍历网络以收集信息的软件组件。
Web上的所有信息都存储在数据库中。它由庞大的Web资源组成。
该组件是用户和数据库之间的接口。它可以帮助用户搜索数据库。
Web搜寻器,数据库和搜索界面是搜索引擎的主要组成部分,实际上使搜索引擎能够正常工作。搜索引擎使用布尔表达式AND,OR或NOT限制和扩展搜索结果。以下是搜索引擎执行的步骤:
搜索引擎在预定义数据库的索引中查找关键字,而不是直接进入Web来搜索关键字。
然后,它使用软件在数据库中搜索信息。该软件组件称为网络搜寻器。
Web搜寻器找到页面后,搜索引擎就会显示相关的网页。这些检索到的网页通常包括页面标题,文本部分的大小,前几个句子等。
这些搜索条件可能因一个搜索引擎而异。根据各种因素对检索到的信息进行排名,例如关键字的频率,信息的相关性,链接等。
用户可以单击任何搜索结果以将其打开。
搜索引擎架构包括以下三个基本层:
内容收集和完善。
搜索核心
用户和应用程序界面
索引编制过程包括以下三个任务:
文字获取
文字转换
索引创建
它标识并存储用于索引的文档。
它将文档转换为索引术语或特征。
它采用由文本转换创建的索引词并创建数据结构以支持快速搜索。
查询过程包括以下三个任务:
用户互动
排行
评价
它支持创建和完善用户查询并显示结果。
它使用查询和索引来创建文档的排名列表。
它监视和衡量有效性和效率。它是脱机完成的。
以下是当今可用的几种搜索引擎:
Search Engine | Description |
---|---|
It was originally called BackRub. It is the most popular search engine globally. | |
Bing | It was launched in 2009 by Microsoft. It is the latest web-based search engine that also delivers Yahoo’s results. |
Ask | It was launched in 1996 and was originally known as Ask Jeeves. It includes support for match, dictionary, and conversation question. |
AltaVista | It was launched by Digital Equipment Corporation in 1995. Since 2003, it is powered by Yahoo technology. |
AOL.Search | It is powered by Google. |
LYCOS | It is top 5 internet portal and 13th largest online property according to Media Matrix. |
Alexa | It is subsidiary of Amazon and used for providing website traffic information. |