📅  最后修改于: 2020-12-02 05:46:14             🧑  作者: Mango
在上一章中,我们说明了如何将数据添加到JSON和.CSV文件格式的Solr中。在本章中,我们将演示如何使用XML文档格式在Apache Solr索引中添加数据。
假设我们需要使用XML文件格式将以下数据添加到Solr索引中。
Student ID | First Name | Last Name | Phone | City |
---|---|---|---|---|
001 | Rajiv | Reddy | 9848022337 | Hyderabad |
002 | Siddharth | Bhattacharya | 9848022338 | Kolkata |
003 | Rajesh | Khanna | 9848022339 | Delhi |
004 | Preethi | Agarwal | 9848022330 | Pune |
005 | Trupthi | Mohanty | 9848022336 | Bhubaneshwar |
006 | Archana | Mishra | 9848022335 | Chennai |
要将以上数据添加到Solr索引中,我们需要准备一个XML文档,如下所示。将此文档保存在名为sample.xml的文件中。
001
Rajiv
Reddy
9848022337
Hyderabad
002
Siddarth
Battacharya
9848022338
Kolkata
003
Rajesh
Khanna
9848022339
Delhi
004
Preethi
Agarwal
9848022330
Pune
005
Trupthi
Mohanthy
9848022336
Bhuwaeshwar
006
Archana
Mishra
9848022335
Chennai
如您所见,为向索引添加数据而编写的XML文件包含三个重要标记,分别是
add-这是用于将文档添加到索引的根标签。它包含一个或多个要添加的文档。
doc-我们添加的文档应包装在
field-字段标签保存文档字段的名称和值。
准备文档后,可以使用上一章中讨论的任何方法将此文档添加到索引中。
假设XML文件存在于Solr的bin目录中,并且将在名为my_core的核心中建立索引,那么您可以使用post工具将其添加到Solr索引中,如下所示-
[Hadoop@localhost bin]$ ./post -c my_core sample.xml
执行上述命令后,您将获得以下输出。
/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-
core6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files
org.apache.Solr.util.SimplePostTool sample.xml
SimplePostTool version 5.0.0
Posting files to [base] url http://localhost:8983/Solr/my_core/update...
Entering auto mode. File endings considered are xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,
xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,htm,html,txt,log
POSTing file sample.xml (application/xml) to [base]
1 files indexed.
COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update...
Time spent: 0:00:00.201
访问Apache Solr Web界面的主页,然后选择核心my_core 。尝试通过在文本区域q中传递查询“:”来检索所有文档,然后执行查询。在执行时,您可以观察到所需的数据已添加到Solr索引中。