📜  数据仓库和数据挖掘之间的区别

📅  最后修改于: 2021-09-08 15:19:20             🧑  作者: Mango

数据仓库用于支持管理功能,而数据挖掘用于从数据中提取有用的信息和模式。数据仓库是将信息编译成数据仓库的过程。

数据仓库:
它是一种聚合来自一个或多个来源的结构化数据的技术,以便可以对这些数据进行比较和分析,而不是进行事务处理。数据仓库旨在通过提供用于数据清理、数据集成和数据整合的平台来支持管理决策过程。数据仓库包含面向主题的、集成的、时变的和非易失性的数据。

数据仓库整合来自多个来源的数据,同时确保数据质量、一致性和准确性。数据仓库通过将分析处理与跨国数据库分开来提高系统性能。数据从各种数据库流入数据仓库。数据仓库的工作原理是将数据组织成描述数据布局和类型的模式。查询工具使用模式分析数据表。

图 –数据仓库流程

数据挖掘:
它是在大型数据集中查找模式和相关性以识别数据之间关系的过程。数据挖掘工具允许商业组织预测客户行为。数据挖掘工具用于构建风险模型和检测欺诈。数据挖掘用于市场分析和管理、欺诈检测、企业分析和风险管理。

图 –数据挖掘过程

数据挖掘和数据仓库的比较:

Data Warehousing Data Mining
A data warehouse is database system which is designed for analytical analysis instead of transactional work. Data mining is the process of analyzing data patterns.
Data is stored periodically. Data is analyzed regularly.
Data warehousing is the process of extracting and storing data to allow easier reporting. Data mining is the use of pattern recognition logic to identify patterns
Data warehousing is solely carried out by engineers. Data mining is carried by business users with the help of engineers.
Data warehousing is the process of pooling all relevant data together. Data mining is considered as a process of extracting data from large data sets.