数据仓库用于支持管理功能,而数据挖掘用于从数据中提取有用的信息和模式。数据仓库是将信息编译成数据仓库的过程。
数据仓库:
它是一种聚合来自一个或多个来源的结构化数据的技术,以便可以对这些数据进行比较和分析,而不是进行事务处理。数据仓库旨在通过提供用于数据清理、数据集成和数据整合的平台来支持管理决策过程。数据仓库包含面向主题的、集成的、时变的和非易失性的数据。
数据仓库整合来自多个来源的数据,同时确保数据质量、一致性和准确性。数据仓库通过将分析处理与跨国数据库分开来提高系统性能。数据从各种数据库流入数据仓库。数据仓库的工作原理是将数据组织成描述数据布局和类型的模式。查询工具使用模式分析数据表。
数据挖掘:
它是在大型数据集中查找模式和相关性以识别数据之间关系的过程。数据挖掘工具允许商业组织预测客户行为。数据挖掘工具用于构建风险模型和检测欺诈。数据挖掘用于市场分析和管理、欺诈检测、企业分析和风险管理。
数据挖掘和数据仓库的比较:
Data Warehousing | Data Mining |
---|---|
A data warehouse is database system which is designed for analytical analysis instead of transactional work. | Data mining is the process of analyzing data patterns. |
Data is stored periodically. | Data is analyzed regularly. |
Data warehousing is the process of extracting and storing data to allow easier reporting. | Data mining is the use of pattern recognition logic to identify patterns |
Data warehousing is solely carried out by engineers. | Data mining is carried by business users with the help of engineers. |
Data warehousing is the process of pooling all relevant data together. | Data mining is considered as a process of extracting data from large data sets. |