📅  最后修改于: 2020-12-02 09:45:47             🧑  作者: Mango
SSIS教程提供了SQL Server Integration Services的基本和高级概念。我们的SSIS教程专为初学者和专业人士设计。
SQL Server集成服务是一种快速灵活的数据仓库工具,用于数据提取,转换和数据加载。这样可以轻松地将数据从一个数据库加载到另一个数据库,例如SQL Server,Oracle,Excel文件等。
在本教程中,我们将讨论以下主题:
数据集成是您遵循的从多个来源集成数据的过程。数据可以是异构数据,也可以是同类数据。数据可以是结构化,半结构化或非结构化的。在数据集成中,来自不同数据源的数据被集成以形成一些有意义的数据。
一些方法用于实现数据集成:
使用SSIS的原因如下:
我们知道SSIS是具有两个功能的平台,即数据集成和工作流。数据转换和工作流创建任务均通过使用SSIS包进行。 SSIS程序包包含三个组件:
操作数据是一个数据库,用于集成来自多个数据源的数据以对数据执行其他操作。在将数据存储到此处以进行当前操作之前,它是发送到数据仓库进行存储,报告或归档的地方。
ETL是一个由三个词组成的概念,但它分为四个阶段:
捕获:捕获阶段也称为提取阶段。在此阶段,它将选择源数据或元数据,并且数据可以采用任何格式,例如xml文件,平面文件或任何数据库文件。
清理:在此阶段,将检查原始数据。它检查数据,是否包含任何错误。它通过使用一些人工智能技术来检查数据的错误或不一致。简而言之,它验证产品的质量是否达到要求。
转换:这是ETL的第三阶段。转换是将原始格式转换为所需的所需格式的过程。转换是根据用户需求建模或更改数据。更改可以是列数或行数的更改。
负载和索引:第四阶段是负载和索引。它加载数据并验证已处理的行数。数据加载完成后,将使用索引。索引可帮助您跟踪数据仓库中加载的行数。索引编制还有助于识别数据,无论其格式是否正确。
数据仓库是单个,完整且一致的数据存储,是通过组合来自多个数据源的数据来制定的。
数据库和数据仓库之间的区别
答案可以是,也可以不是。数据库和数据仓库都具有大量的数据单元和相似的物理表示形式,但是数据仓库中复杂查询的响应时间比数据库快。
以下是安装SQL Server Integration Services的要求:
请按照以下步骤安装SQL Server数据工具:
步骤1:单击链接https://docs.microsoft.com/zh-cn/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql -server-2017下载SQL Server数据工具。
步骤2:当您点击以上链接时,屏幕显示如下:
在上面的屏幕中,选择要安装的SSDT版本。
步骤3:下载完成后,运行下载的文件。运行下载的文件时,将显示以下屏幕:
步骤4:点击“下一步”按钮。
步骤5:选择Visual Studio实例以及要在Visual Studio 2017中安装的工具。
步骤6:点击“安装”按钮。
该包是您在SSIS中进行编码的基本块。在这里,代码并不意味着您正在使用某种编程语言进行编码。这意味着您所做的发展。开发是在SSIS包中完成的。 SSIS主要用于ETL过程,而ETL过程在SSIS包内部执行。
SSIS软件包包括三个部分:
在SSIS包中,我们可以添加任务。任务是工作的一个单元,我们将有不同类型的任务来执行不同类型的工作。任务有多种类型,但是我们将讨论SSIS中最常用的任务:
让我们看一下数据集成服务的一些工作示例。
步骤1:首先,我们在Microsoft Excel中创建一个excel文件。假设我在Microsoft Excel中创建了学生数据库,并且学生表中的字段是student_id,student_name,标记和性别。
步骤2:打开Visual Studio(SQL Server数据工具)。
步骤3:单击File(文件)选项,然后移至New-> Project。
步骤4:当您点击Project时,将出现以下屏幕:
在上面的屏幕中,单击面板最左侧出现的Integration Services,然后单击Integration Services项目。
步骤5:单击Integration Services Project选项后,屏幕显示如下:
上面的屏幕包含五个选项卡,例如控制流,数据流,参数,事件处理程序和程序包资源管理器。我们已经讨论了控制流和数据流,控制流和数据流都存在于SSIS包中。
步骤6:要导入数据,我们首先需要创建数据库,并在其中创建SQL Server数据库中的表。我们知道学生数据在Excel文件中可用,并且我们想将数据导入SQL Server数据库中。为了实现这一点,我们首先需要在SQL Server中创建表。打开SQL Server管理工作室。
步骤7:创建学生数据库。右键单击数据库,然后单击“新建数据库”选项。
步骤8:在以下屏幕截图中输入数据库名称:
我已将StudentWarehouse作为数据库名称。
步骤9:点击OK(确定)按钮。
步骤10:现在,我们在StudentWarehouse数据库中创建表。用鼠标右键单击表,然后单击新建表。
步骤11:现在,我们将字段添加到表格中,例如:student_id,student_name,标记和性别。我们将student_id设置为唯一标识每一行的主键。
上面的屏幕显示我们在一个表中添加了四个字段。在表中添加所有字段后,我们通过提供一些有用的名称来保存表。假设我提供了该学生作为表格名称。
步骤12:回到视觉工作室。控制流包含数据流任务,将数据流任务拖放到主窗口上。
步骤13:当我们双击Data Flow Task时,控件自动从Control Flow移到Data Flow,因此我们可以说Control Flow是Data Flow的容器。
步骤14:现在,我们可以在数据流中执行转换。我们希望从先前创建的Excel文件中提取数据,因此请从面板最左侧出现的其他源中拖放Excel源。
从上面的屏幕中,我们观察到Excel Source内部出现红叉,这表示该组件已配置Excel Source。
步骤15:要配置组件,请右键单击Excel源,然后单击Edit(编辑)选项,如以下屏幕截图所示:
步骤16:填写以下屏幕快照中显示的详细信息:
步骤17:输入所有详细信息后,屏幕显示如下:
步骤18:点击Excel Souce。
上面的屏幕显示了两个箭头,红色和蓝色箭头。蓝色箭头定义了我们从Excel文件接收的实际数据,红色箭头表示了我们所存在的错误。现在我们必须执行转换,并且在执行转换之前,我们需要加载数据库。
步骤19:要加载数据库,请单击“其他目标”,然后单击“目标”。
步骤20:添加目的地后,将源连接到目的地。
步骤21:在上面的步骤中,我们注意到ADO NET Destination中的红叉,这意味着它没有配置组件。右键单击ADO NET Destination,然后单击Edit选项,如下面的屏幕快照所示:
步骤22:您需要指定配置管理器。
步骤23:点击New(新建)按钮添加连接管理器。当您单击“新建”按钮时,屏幕显示如下:
步骤24:添加服务器名称,然后从SQL Server中选择数据库名称。
步骤25:点击OK(确定)按钮。
步骤26:添加要在其中加载数据的表名。
步骤27:在下面的屏幕中,将输入源的字段映射到目标源的字段。
步骤28:添加映射后,源连接到目标,如以下屏幕截图所示:
步骤29:单击开始按钮以运行Integration Services项目。运行项目时,数据将加载到目标位置,即SQL Server 。
在上面的屏幕中,我们观察到在执行SQL任务中出现红叉,这意味着未使用执行SQL任务配置连接管理器。要配置它,我们需要添加连接管理器。
在上面的屏幕中,我们观察到如上一步中创建的那样,StudentWarehouse数据库的数据连接已经可用。单击确定按钮。
在上面的屏幕中,您需要输入详细信息,例如任务名称,描述,SQL语句(您需要在表上执行的SQL任务)。
在以上情况下,我在SQLStatement中提供了insert命令。
在上面的屏幕中,刻度线显示您的SQL任务已成功完成。我们在前面的步骤中添加的insert语句已执行,数据已添加到表中。即学生1。
在学习SSIS之前,您必须具有SQL Server的基本知识。
我们的SSIS教程旨在帮助初学者和专业人士。
我们保证您在本SSIS教程中不会发现任何问题。但是,如果有任何错误或错误,请在联系表格中张贴错误。