📅  最后修改于: 2020-11-10 04:25:54             🧑  作者: Mango
本章将引导您完成在Windows和Linux上设置Apache Tika的过程。安装Apache Tika时需要用户管理。
JDK | Java SE 2 JDK 1.6 or above |
Memory | 1 GB RAM (recommeneded) |
Disk Space | No minimum requirement |
Operating System Version | Windows XP or above, Linux |
要验证Java安装,请打开控制台并执行以下Java命令。
OS | Task | Command |
---|---|---|
Windows | Open command console | \>java –version |
Linux | Open command terminal | $java –version |
如果您的系统上已经正确安装了Java,则应该获得以下输出之一,具体取决于所使用的平台。
OS | Output |
---|---|
Windows |
Java version “1.7.0_60” Java (TM) SE Run Time Environment (build 1.7.0_60-b19) Java Hotspot (TM) 64-bit Server VM (build 24.60-b09, mixed mode) |
Lunix |
java version “1.7.0_25” Open JDK Runtime Environment (rhel-2.3.10.4.el6_4-x86_64) Open JDK 64-Bit Server VM (build 23.7-b01, mixed mode) |
我们假定本教程的读者在继续本教程之前,已经在系统上安装了Java 1.7.0_60。
如果您没有Java SDK,请从https://www.oracle.com/technetwork/java/javase/downloads/index.html下载其最新版本并进行安装。
将JAVA_HOME环境变量设置为指向您的计算机上安装Java的基本目录位置。例如,
OS | Output |
---|---|
Windows | Set Environmental variable JAVA_HOME to C:\ProgramFiles\java\jdk1.7.0_60 |
Linux | export JAVA_HOME = /usr/local/java-current |
将Java编译器位置的完整路径追加到系统路径。
OS | Output |
---|---|
Windows | Append the String; C:\Program Files\Java\jdk1.7.0_60\bin to the end of the system variable PATH. |
Linux | export PATH = $PATH:$JAVA_HOME/bin/ |
如上所述,从命令提示符处验证命令java-version。
程序员可以使用以下命令将Apache Tika集成到他们的环境中
对于这些方法中的任何一种,首先,您必须下载Tika的源代码。
您可以在https://Tika.apache.org/download.html找到Tika的源代码,在这里您将找到两个链接-
apache – tika – 1.6 – src.zip-包含Tika的源代码,以及
Tika -app-1.6.jar-这是一个包含Tika应用程序的jar文件。
下载这两个文件。 Tika官方网站的快照如下所示。
下载文件后,设置jar文件tika-app-1.6.jar的类路径。如下表所示,添加jar文件的完整路径。
OS | Output |
---|---|
Windows | Append the String “C:\jars\Tika-app-1.6.jar” to the user environment variable CLASSPATH |
Linux |
Export CLASSPATH = $CLASSPATH − /usr/share/jars/Tika-app-1.6.tar − |
Apache提供了Tika应用程序,这是使用Eclipse的图形用户界面(GUI)应用程序。
打开eclipse并创建一个新项目。
如果您的Eclipse中没有Maven,请按照给定的步骤进行设置。
打开链接https://wiki.eclipse.org/M2E_updatesite_and_gittags 。在那里,您可以找到表格格式的m2e插件版本
选择最新版本,然后将网址路径保存在p2网址列中。
现在重新访问Eclipse,在菜单栏中,单击“帮助” ,然后从下拉菜单中选择“安装新软件” 。
单击添加按钮,键入任何所需的名称,因为它是可选的。现在,将保存的网址粘贴到“位置”字段中。
将添加一个具有您在上一步中选择的名称的新插件,选中它前面的复选框,然后单击Next 。
继续安装。完成后,重新启动Eclipse。
现在,右键单击该项目,然后在configure选项中,选择convert to maven project 。
出现用于创建新pom的新向导。输入组ID为org.apache.tika,输入最新版本的Tika,选择包装为jar,然后点击完成。
Maven项目已成功安装,并且您的项目已转换为Maven。现在,您必须配置pom.xml文件。
从https://mvnrepository.com/artifact/org.apache.tika获取Tika Maven依赖项
下面显示的是Apache Tika的完整Maven依赖关系。
org.apache.Tika
Tika-core
1.6
org.apache.Tika
Tika-parsers
1.6
org.apache.Tika
Tika
1.6
org.apache.Tika
< artifactId>Tika-serialization
< version>1.6< /version>
< groupId>org.apache.Tika< /groupId>
< artifactId>Tika-app< /artifactId>
< version>1.6< /version>
org.apache.Tika
Tika-bundle
1.6