📜  启动Sqoop

📅  最后修改于: 2020-12-03 09:03:18             🧑  作者: Mango

启动Sqoop

Sqoop是具有以下结构的命令行工具

sqoop TOOL PROPERTY_ARGS SQOOP_ARGS [-- EXTRA_ARGS]
  • 工具指示操作,例如:“导入”,“导出”。
  • PROPERTY_ARGS是Java属性,格式为“ -Dname = value”
  • SQOOP_ARGS提到了各种Sqoop参数
  • EXTRA_ARGS用于专用连接器,以“-”与SQOOP_ARGS分开

例:

% sqoop import --connect jdbc:mysql://localhost/hadoopguide --table widgets -m 1

输入“ sqoop帮助”以获取所有可用工具:

后端会发生什么

当您决定将数据从RDBMS移到HDFS时,首先使用的产品是Apache Sqoop。当您请求将数据带到HDFS时,会发生以下情况。

  • Sqoop从Relation DB请求元数据信息。
  • 关系数据库返回所需的请求。
  • Sqoop基于元数据信息生成Java类。
  • 在表中基于主ID进行分区,因为多个映射器将同时导入数据。