📝 Apache Solr教程

18篇技术文档
  Apache Solr教程

📅  最后修改于: 2020-12-02 05:41:36        🧑  作者: Mango

Solr是一个可扩展的,易于部署的搜索/存储引擎,经过优化,可以搜索大量以文本为中心的数据。 Solr具有企业级,快速和高度可扩展性。在本教程中,我们将学习Solr的基础知识以及如何在实践中使用它。本教程对于所有想了解Apache Solr的基本功能以开发复杂而高性能的应用程序的开发人员都将有所帮助。先决条件在继续学习本教程之前,我们希望读者具有良好的Java编程技能(尽管不是强制性的),并且应该...

  Apache Solr-概述

📅  最后修改于: 2020-12-02 05:42:03        🧑  作者: Mango

Solr是一个开源搜索平台,用于构建搜索应用程序。它建立在Lucene(全文搜索引擎)之上。 Solr具有企业级,快速和高度可扩展性。使用Solr构建的应用程序非常复杂,并提供了高性能。Yonik Seely于2004年创立了Solr,目的是向CNET Networks公司的网站添加搜索功能。在2006年1月,它成为Apache Software Foundation下的一个开源项目。它的最新版本...

  Apache Solr-搜索引擎基础知识

📅  最后修改于: 2020-12-02 05:42:25        🧑  作者: Mango

搜索引擎是指庞大的Internet资源数据库,例如网页,新闻组,程序,图像等。它有助于在Internet上定位信息。用户可以通过将查询以关键字或短语的形式传递到搜索引擎中来搜索信息。然后,搜索引擎在其数据库中搜索并将相关链接返回给用户。搜索引擎组件通常,搜索引擎包含以下三个基本组成部分-Web爬虫-Web爬虫也称为蜘蛛或机器人。它是遍历网络以收集信息的软件组件。数据库-Web上的所有信息都存储在数...

  Apache Solr-在Windows环境中

📅  最后修改于: 2020-12-02 05:42:43        🧑  作者: Mango

在本章中,我们将讨论如何在Windows环境中设置Solr。要在Windows系统上安装Solr,您需要执行以下步骤-访问Apache Solr的主页,然后单击下载按钮。选择其中一个镜像以获取Apache Solr的索引。从那里下载名为Solr-6.2.0.zip的文件。将文件从下载文件夹移至所需目录并解压缩。假设您下载了Solr fie,并将其解压缩到C驱动器中。在这种情况下,您可以启动Solr...

  Apache Solr-在Hadoop上

📅  最后修改于: 2020-12-02 05:43:31        🧑  作者: Mango

Solr可以与Hadoop一起使用。由于Hadoop处理大量数据,Solr帮助我们从如此大量的资源中查找所需的信息。在本节中,让我们了解如何在系统上安装Hadoop。下载Hadoop下面给出了将Hadoop下载到系统上要遵循的步骤。步骤1-转到Hadoop的主页。您可以使用链接-www.hadoop.apache.org/。单击链接Releases,如以下屏幕快照中突出显示。它将重定向到Apach...

  Apache Solr-体系结构

📅  最后修改于: 2020-12-02 05:43:52        🧑  作者: Mango

在本章中,我们将讨论Apache Solr的体系结构。下图显示了Apache Solr的体系结构框图。Solr建筑─积木以下是Apache Solr的主要构建模块(组件)-请求处理程序-我们发送到Apache Solr的请求由这些请求处理程序处理。这些请求可以是查询请求或索引更新请求。根据我们的要求,我们需要选择请求处理程序。为了将请求传递给Solr,我们通常会将处理程序映射到某个URI端点,并且...

  Apache Solr-术语

📅  最后修改于: 2020-12-02 05:44:15        🧑  作者: Mango

在本章中,我们将尝试了解在Solr上工作时经常使用的某些术语的真实含义。一般术语以下是在所有类型的Solr设置中使用的通用术语列表-实例-就像tomcat实例或码头实例一样,该术语指的是在JVM内运行的应用程序服务器。 Solr的主目录提供对每个这些Solr实例的引用,其中可以将一个或多个内核配置为在每个实例中运行。核心-在应用程序中运行多个索引时,每个实例中可以有多个核心,而不是每个实例都具有一...

  Apache Solr-基本命令

📅  最后修改于: 2020-12-02 05:44:43        🧑  作者: Mango

启动Solr安装Solr之后,浏览到Solr主目录中的bin文件夹,然后使用以下命令启动Solr。该命令在后台启动Solr,通过显示以下消息侦听端口8983。在前台启动Solr如果使用start命令启动Solr,则Solr将在后台启动。相反,您可以使用–f选项在前台启动Solr。在另一个端口上启动Solr使用start命令的–p选项,我们可以在另一个端口中启动Solr,如以下代码块所示。停止Sol...

  Apache Solr-核心

📅  最后修改于: 2020-12-02 05:45:08        🧑  作者: Mango

Solr核心是Lucene索引的运行实例,其中包含使用它所需的所有Solr配置文件。我们需要创建一个Solr Core来执行诸如索引和分析之类的操作。Solr应用程序可能包含一个或多个核心。如有必要,Solr应用程序中的两个内核可以相互通信。创建核心安装并启动Solr之后,您可以连接到Solr的客户端(Web界面)。如以下屏幕快照中突出显示的那样,Apache Solr最初没有内核。现在,我们将看...

  Apache Solr-索引数据

📅  最后修改于: 2020-12-02 05:45:47        🧑  作者: Mango

通常,索引是系统地安排文档或(其他实体)的。索引使用户可以定位文档中的信息。索引收集,解析和存储文档。进行索引可以提高查找所需文档时搜索查询的速度和性能。在Apache Solr中建立索引在Apache Solr中,我们可以索引(添加,删除,修改)各种文档格式,例如xml,csv,pdf等。我们可以通过几种方式向Solr索引添加数据。在本章中,我们将讨论索引-使用Solr Web界面。使用任何客户...

  Apache Solr-添加文档(XML)

📅  最后修改于: 2020-12-02 05:46:14        🧑  作者: Mango

在上一章中,我们说明了如何将数据添加到JSON和.CSV文件格式的Solr中。在本章中,我们将演示如何使用XML文档格式在Apache Solr索引中添加数据。样本数据假设我们需要使用XML文件格式将以下数据添加到Solr索引中。Student IDFirst NameLast NamePhoneCity001RajivReddy9848022337Hyderabad002SiddharthBha...

  Apache Solr-更新数据

📅  最后修改于: 2020-12-02 05:46:37        🧑  作者: Mango

使用XML更新文档以下是用于更新现有文档中的字段的XML文件。将其保存在名为update.xml的文件中。如您所见,编写用于更新数据的XML文件就像我们用来添加文档的XML文件一样。但是唯一的区别是我们使用字段的update属性。在我们的示例中,我们将使用上面的文档,并尝试使用id001更新文档的字段。假设XML文档存在于Solr的bin目录中。由于我们正在更新名为my_core的内核中存在的索引...

  Apache Solr-删除文档

📅  最后修改于: 2020-12-02 05:47:08        🧑  作者: Mango

删除文件要从Apache Solr的索引中删除文档,我们需要在<delete> </ delete>标记之间指定要删除的文档的ID。在此,此XML代码用于删除ID为003和005的文档。将此代码保存在名为delete.xml的文件中。如果要从属于名为my_core的核心的索引中删除文档,则可以使用发布工具发布delete.xml文件,如下所示。执行上述命令后,您将获得以下输出。验证访问Apache...

  Apache Solr-检索数据

📅  最后修改于: 2020-12-02 05:47:26        🧑  作者: Mango

在本章中,我们将讨论如何使用Java Client API检索数据。假设我们有一个名为sample.csv的.csv文档,内容如下。您可以使用post命令在名为sample_Solr的内核下对该数据建立索引。以下是将文档添加到Apache Solr索引的Java程序。将此代码保存在名为RetrievingData.java的文件中。通过在终端中执行以下命令来编译以上代码-执行上述命令后,您将获得以...

  Apache Solr-查询数据

📅  最后修改于: 2020-12-02 05:47:50        🧑  作者: Mango

除了存储数据之外,Apache Solr还提供了在需要时进行查询的功能。 Solr提供了某些参数,通过这些参数我们可以查询存储在其中的数据。在下表中,我们列出了Apache Solr中可用的各种查询参数。ParameterDescriptionqThis is the main query parameter of Apache Solr, documents are scored by thei...