📅  最后修改于: 2023-12-03 15:29:33.624000             🧑  作者: Mango
Azure 数据工厂是一种云数据集成服务,可让您有效地管理和处理数据。它可以帮助您从各种数据来源中提取、转换和加载数据,从而提供了一个建立现代数据仓库的工具。
使用 Azure 数据工厂,您可以:
Azure 数据工厂具有以下三个核心组件:
数据源可以是几个来源的数据。
数据处理器是Azure数据工厂的核心部分。它们对数据执行ETL操作(提取、转换和加载操作)或ELT操作(提取、加载和转换操作),以将数据从一种格式转换为另一种格式。
数据处理器可以是:
Azure 数据工厂可以使用以下启动器来启动管道。
要开始使用Azure数据工厂,您需要完成以下步骤:
下面是一个完整的 Azure 数据工厂的示例:
{
"name": "AzureDataFactory",
"location": "[resourceGroup().location]",
"identity": {
"type": "SystemAssigned"
},
"properties": {
"description": "Azure Data Factory",
"linkedServices": [],
"datasets": [],
"pipelines": [
{
"name": "DataPipeline",
"properties": {
"description": "Data Pipeline",
"activities": [
{
"name": "CopyBlobStorage",
"type": "Copy",
"dependsOn": [],
"policy": {
"timeout": "7.00:00:00",
"retry": 0,
"retryIntervalInSeconds": 30,
"secureOutput": false,
"secureInput": false
},
"userProperties": [],
"typeProperties": {
"source": {
"type": "BlobSource",
"recursive": true
},
"sink": {
"type": "BlobSink"
},
"enableStaging": false,
"translator": {
"type": "TabularTranslator",
"mappings": []
},
"parallelCopies": -1,
"preserveHierarchy": false
},
"inputs": [
{
"referenceName": "BlobDataSet",
"parameters": {
"batchId": {
"value": "@trigger().outputs.windowStartTime"
}
}
}
],
"outputs": [
{
"referenceName": "BlobDataSet"
}
]
}
],
"parameters": {},
"variables": {}
}
}
],
"integrationRuntimes": [],
"triggers": []
}
}