在本文中,我们将讨论数据的分类,其中将涵盖结构化,非结构化数据和半结构化数据。此外,我们还将介绍数据的功能。让我们一一讨论。
数据分类:
将数据分类为相关类别的过程,以便可以更有效地使用或应用数据。数据分类使用户易于检索。数据分类在涉及数据安全性和合规性以及满足不同类型的业务或个人目标方面具有重要意义。这也是主要要求,因为必须在特定时间段内轻松检索数据。
数据分类的类型:
数据可大致分为3种类型。
1.结构化数据:
结构化数据是使用固定模式创建的,并以表格格式进行维护。结构化数据中的元素可寻址以进行有效分析。它包含所有可以表格形式存储在SQL数据库中的数据。如今,大多数数据都以最简单的方式来开发和处理,以管理信息。
例子 –
关系数据,地理位置,信用卡号,地址等
考虑一下关系数据的示例,例如您必须维护大学的学生记录,例如学生的姓名,学生的ID,地址和学生的电子邮件。为了存储学生的记录,使用了以下关系模式和表。
S_ID | S_Name | S_Address | S_Email |
1001 | A | Delhi | A@gmail.com |
1002 | B | Mumbai | B@gmail.com |
2.非结构化数据:
它被定义为不遵循预定义标准的数据,或者您可以说任何数据都不遵循任何有组织的格式。这种数据也不适合关系数据库,因为在关系数据库中,您将看到预定义的方式,或者可以说是组织的数据方式。非结构化数据对于大数据域也非常重要,要管理和存储非结构化数据,有许多平台可以处理它,例如No-SQL Database。
例子 –
Word,PDF,文本,媒体日志等
3.半结构化数据:
半结构化数据是不驻留在关系数据库中但具有某些组织属性的信息,这些属性使分析变得更容易。通过某些过程,您可以将它们存储在关系数据库中,但是对于某种半结构化数据来说很难,但是存在半结构化以减少空间。
例子 –
XML数据。
数据分类的特点:
数据组织的主要目标是以对用户相当可用的形式安排数据。因此,它的基本功能如下。
- 同质性–特定组中的数据项应该彼此相似。
- 明确性–特定组中任何数据项的位置都不应混淆。
- 稳定性–数据项集必须稳定,即任何调查都不应影响同一组分类。
- 弹性–随着分类目的的改变,人们应该能够改变分类的基础。