📅  最后修改于: 2020-11-29 08:23:17             🧑  作者: Mango
本章介绍如何创建和维护Sqoop作业。 Sqoop作业创建并保存导入和导出命令。它指定参数以识别和调用已保存的作业。这种调用或重新执行在增量导入中使用,增量导入可以将更新后的行从RDBMS表导入到HDFS。
以下是用于创建Sqoop作业的语法。
$ sqoop job (generic-args) (job-args)
[-- [subtool-name] (subtool-args)]
$ sqoop-job (generic-args) (job-args)
[-- [subtool-name] (subtool-args)]
在这里,我们正在创建一个名为myjob的作业,该作业可以将表数据从RDBMS表导入到HDFS。以下命令用于创建将数据从db数据库中的employee表导入HDFS文件的作业。
$ sqoop job --create myjob \
-- import \
--connect jdbc:mysql://localhost/db \
--username root \
--table employee --m 1
‘–list’参数用于验证已保存的作业。以下命令用于验证已保存的Sqoop作业列表。
$ sqoop job --list
它显示已保存作业的列表。
Available jobs:
myjob
“ –show”自变量用于检查或验证特定作业及其详细信息。以下命令和示例输出用于验证名为myjob的作业。
$ sqoop job --show myjob
它显示了myjob中使用的工具及其选项。
Job: myjob
Tool: import Options:
----------------------------
direct.import = true
codegen.input.delimiters.record = 0
hdfs.append.dir = false
db.table = employee
...
incremental.last.value = 1206
...
‘–exec’选项用于执行保存的作业。以下命令用于执行名为myjob的已保存作业。
$ sqoop job --exec myjob
它向您显示以下输出。
10/08/19 13:08:45 INFO tool.CodeGenTool: Beginning code generation
...