📜  TIKA-环境

📅  最后修改于: 2020-11-10 04:25:54             🧑  作者: Mango


本章将引导您完成在Windows和Linux上设置Apache Tika的过程。安装Apache Tika时需要用户管理。

系统要求

JDK Java SE 2 JDK 1.6 or above
Memory 1 GB RAM (recommeneded)
Disk Space No minimum requirement
Operating System Version Windows XP or above, Linux

步骤1:验证Java安装

要验证Java安装,请打开控制台并执行以下Java命令。

OS Task Command
Windows Open command console \>java –version
Linux Open command terminal $java –version

如果您的系统上已经正确安装了Java,则应该获得以下输出之一,具体取决于所使用的平台。

OS Output
Windows

Java version “1.7.0_60”

Java (TM) SE Run Time Environment (build 1.7.0_60-b19)

Java Hotspot (TM) 64-bit Server VM (build 24.60-b09, mixed mode)

Lunix

java version “1.7.0_25”

Open JDK Runtime Environment (rhel-2.3.10.4.el6_4-x86_64)

Open JDK 64-Bit Server VM (build 23.7-b01, mixed mode)

步骤2:设定Java环境

将JAVA_HOME环境变量设置为指向您的计算机上安装Java的基本目录位置。例如,

OS Output
Windows Set Environmental variable JAVA_HOME to C:\ProgramFiles\java\jdk1.7.0_60
Linux export JAVA_HOME = /usr/local/java-current

将Java编译器位置的完整路径追加到系统路径。

OS Output
Windows Append the String; C:\Program Files\Java\jdk1.7.0_60\bin to the end of the system variable PATH.
Linux export PATH = $PATH:$JAVA_HOME/bin/

如上所述,从命令提示符处验证命令java-version。

步骤3:设定Apache Tika环境

程序员可以使用以下命令将Apache Tika集成到他们的环境中

  • 命令行,
  • Tika API,
  • Tika的命令行界面(CLI)
  • Tika的图形用户界面(GUI),或
  • 源代码。

对于这些方法中的任何一种,首先,您必须下载Tika的源代码。

您可以在https://Tika.apache.org/download.html找到Tika的源代码,在这里您将找到两个链接-

  • apachetika1.6src.zip-包含Tika的源代码,以及

  • Tika -app-1.6.jar-这是一个包含Tika应用程序的jar文件。

下载这两个文件。 Tika官方网站的快照如下所示。

蒂卡环境

下载文件后,设置jar文件tika-app-1.6.jar的类路径。如下表所示,添加jar文件的完整路径。

OS Output
Windows Append the String “C:\jars\Tika-app-1.6.jar” to the user environment variable CLASSPATH
Linux

Export CLASSPATH = $CLASSPATH −

/usr/share/jars/Tika-app-1.6.tar −

Apache提供了Tika应用程序,这是使用Eclipse的图形用户界面(GUI)应用程序。

使用Eclipse的Tika-Maven构建

m2e发布

  • 选择最新版本,然后将网址路径保存在p2网址列中。

  • 现在重新访问Eclipse,在菜单栏中,单击“帮助” ,然后从下拉菜单中选择“安装新软件”

蚀

  • 单击添加按钮,键入任何所需的名称,因为它是可选的。现在,将保存的网址粘贴到“位置”字段中。

  • 将添加一个具有您在上一步中选择的名称的新插件,选中它前面的复选框,然后单击Next

安装

  • 继续安装。完成后,重新启动Eclipse。

  • 现在,右键单击该项目,然后在configure选项中,选择convert to maven project

  • 出现用于创建新pom的新向导。输入组ID为org.apache.tika,输入最新版本的Tika,选择包装为jar,然后点击完成

Maven项目已成功安装,并且您的项目已转换为Maven。现在,您必须配置pom.xml文件。

配置XML文件

https://mvnrepository.com/artifact/org.apache.tika获取Tika Maven依赖项

下面显示的是Apache Tika的完整Maven依赖关系。


   org.apache.Tika
   Tika-core
   1.6

   org.apache.Tika
    Tika-parsers
    1.6

    org.apache.Tika
   Tika
   1.6

   org.apache.Tika
   < artifactId>Tika-serialization
   < version>1.6< /version>

   < groupId>org.apache.Tika< /groupId>
   < artifactId>Tika-app< /artifactId>
   < version>1.6< /version>

   org.apache.Tika
   Tika-bundle
   1.6