数据通用化是通过将较高级别的概念替换为较低级别的值来汇总数据的过程。它是描述性数据挖掘的一种形式。
数据概括有两种基本方法:
1.数据立方体方法:
- 它也称为OLAP方法。
- 这是一种有效的方法,因为它有助于制作过去的销售图表。
- 用这种方法,计算和结果存储在Data多维数据集中。
- 它在数据多维数据集上使用上滚和下钻操作。
- 这些操作通常涉及聚合函数,例如count(),sum(),average()和max()。
- 然后,这些物化视图可用于决策支持,知识发现和许多其他应用程序。
2.面向属性的归纳法:
- 它是一种在线数据分析,面向查询和基于概括的方法。
- 在这种方法中,我们根据相关数据集中每个属性的不同值进行概括。之后,将同一元组合并,并累加它们各自的计数以执行聚合。
- 在提交OLAP或数据挖掘查询进行处理之前,它会执行离线聚合。
- 另一方面,至少在最初的提议中,面向属性的归纳方法是一种面向关系数据库查询的,基于广义的(在线数据分析技术)。
- 它不限于特定的度量或分类数据。
- 面向属性的归纳方法使用两种方法:
(一世)。属性删除。
(ii)。属性泛化。