在本文中,我们将讨论数据的分类,其中我们将涵盖结构化、非结构化数据和半结构化数据。此外,我们将介绍数据的特征。让我们一一讨论。
数据分类:
将数据归入相关类别的过程,以便更有效地使用或应用数据。数据的分类便于用户检索。在涉及数据安全性和合规性以及满足不同类型的业务或个人目标时,数据分类非常重要。这也是一个主要要求,因为数据必须可以在特定时间段内轻松检索。
数据分类类型:
数据大致可以分为3类。
1.结构化数据:
结构化数据是使用固定模式创建的,并以表格格式进行维护。结构化数据中的元素可寻址以进行有效分析。它包含可以以表格格式存储在 SQL 数据库中的所有数据。今天,大多数数据都是以最简单的方式开发和处理的,以管理信息。
例子 –
关系数据、地理位置、信用卡号、地址等。
考虑一个关系数据的例子,比如你必须维护一所大学的学生记录,比如学生的姓名、学生的 ID、地址和学生的电子邮件。为了存储学生的记录,使用了以下关系模式和表。
S_ID | S_Name | S_Address | S_Email |
1001 | A | Delhi | A@gmail.com |
1002 | B | Mumbai | B@gmail.com |
2. 非结构化数据:
它被定义为不遵循预定义标准的数据,或者您可以说任何不遵循任何组织格式的数据。这种数据也不适合关系数据库,因为在关系数据库中你会看到一种预定义的方式或者你可以说数据的组织方式。非结构化数据对于大数据领域也非常重要,为了管理和存储非结构化数据,有许多平台可以像 No-SQL 数据库一样处理它。
例子 –
Word、PDF、文本、媒体日志等。
3. 半结构化数据:
半结构化数据是不存在于关系数据库中但具有一些易于分析的组织属性的信息。通过一些过程,您可以将它们存储在关系数据库中,但对于某种半结构化数据来说非常困难,但半结构化存在以减轻空间。
例子 –
XML 数据。
数据分类的特点:
数据组织的主要目标是以这样一种形式排列数据,使用户可以公平地使用它。所以它的基本功能如下。
- 同质性——特定组中的数据项应该彼此相似。
- 清晰 –特定组中任何数据项的定位不得混淆。
- 稳定性——数据项集必须是稳定的,即任何调查都不应影响同一分类集。
- 弹性——人们应该能够随着分类目的的改变而改变分类的基础。