📅  最后修改于: 2020-12-02 05:47:08             🧑  作者: Mango
要从Apache Solr的索引中删除文档,我们需要在
003
005
004
002
在此,此XML代码用于删除ID为003和005的文档。将此代码保存在名为delete.xml的文件中。
如果要从属于名为my_core的核心的索引中删除文档,则可以使用发布工具发布delete.xml文件,如下所示。
[Hadoop@localhost bin]$ ./post -c my_core delete.xml
执行上述命令后,您将获得以下输出。
/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core
6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files
org.apache.Solr.util.SimplePostTool delete.xml
SimplePostTool version 5.0.0
Posting files to [base] url http://localhost:8983/Solr/my_core/update...
Entering auto mode. File endings considered are
xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,
rtf,htm,html,txt,log
POSTing file delete.xml (application/xml) to [base]
1 files indexed.
COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update...
Time spent: 0:00:00.179
访问Apache Solr Web界面的主页,然后选择核心作为my_core 。尝试通过在文本区域q中传递查询“:”来检索所有文档,然后执行查询。执行时,您会看到指定的文档已删除。
有时我们需要根据ID以外的其他字段删除文档。例如,我们可能必须删除城市为金奈的文件。
在这种情况下,您需要在
city:Chennai
将其另存为delete_field.xml,并使用Solr的发布工具在名为my_core的内核上执行删除操作。
[Hadoop@localhost bin]$ ./post -c my_core delete_field.xml
执行上述命令后,将产生以下输出。
/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core
6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files
org.apache.Solr.util.SimplePostTool delete_field.xml
SimplePostTool version 5.0.0
Posting files to [base] url http://localhost:8983/Solr/my_core/update...
Entering auto mode. File endings considered are
xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,
rtf,htm,html,txt,log
POSTing file delete_field.xml (application/xml) to [base]
1 files indexed.
COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update...
Time spent: 0:00:00.084
访问Apache Solr Web界面的主页,然后选择核心作为my_core 。尝试通过在文本区域q中传递查询“:”来检索所有文档,然后执行查询。执行时,您会发现包含指定字段值对的文档已被删除。
就像删除特定字段一样,如果要从索引中删除所有文档,只需在标签
*:*
将其另存为delete_all.xml,并使用Solr的发布工具在名为my_core的内核上执行删除操作。
[Hadoop@localhost bin]$ ./post -c my_core delete_all.xml
执行上述命令后,将产生以下输出。
/home/Hadoop/java/bin/java -classpath /home/Hadoop/Solr/dist/Solr-core
6.2.0.jar -Dauto = yes -Dc = my_core -Ddata = files
org.apache.Solr.util.SimplePostTool deleteAll.xml
SimplePostTool version 5.0.0
Posting files to [base] url http://localhost:8983/Solr/my_core/update...
Entering auto mode. File endings considered are
xml,json,jsonl,csv,pdf,doc,docx,ppt,pptx,xls,xlsx,odt,odp,ods,ott,otp,ots,rtf,
htm,html,txt,log
POSTing file deleteAll.xml (application/xml) to [base]
1 files indexed.
COMMITting Solr index changes to http://localhost:8983/Solr/my_core/update...
Time spent: 0:00:00.138
访问Apache Solr Web界面的主页,然后选择核心作为my_core 。尝试通过在文本区域q中传递查询“:”来检索所有文档,然后执行查询。执行时,您会发现包含指定字段值对的文档已被删除。
以下是将文档添加到Apache Solr索引的Java程序。将此代码保存在名为UpdatingDocument.java的文件中。
import java.io.IOException;
import org.apache.Solr.client.Solrj.SolrClient;
import org.apache.Solr.client.Solrj.SolrServerException;
import org.apache.Solr.client.Solrj.impl.HttpSolrClient;
import org.apache.Solr.common.SolrInputDocument;
public class DeletingAllDocuments {
public static void main(String args[]) throws SolrServerException, IOException {
//Preparing the Solr client
String urlString = "http://localhost:8983/Solr/my_core";
SolrClient Solr = new HttpSolrClient.Builder(urlString).build();
//Preparing the Solr document
SolrInputDocument doc = new SolrInputDocument();
//Deleting the documents from Solr
Solr.deleteByQuery("*");
//Saving the document
Solr.commit();
System.out.println("Documents deleted");
}
}
通过在终端中执行以下命令来编译以上代码-
[Hadoop@localhost bin]$ javac DeletingAllDocuments
[Hadoop@localhost bin]$ java DeletingAllDocuments
执行上述命令后,您将获得以下输出。
Documents deleted