📜  什么是结构化数据?

📅  最后修改于: 2021-09-08 15:28:14             🧑  作者: Mango

结构化数据是符合数据模型、具有明确定义的结构、遵循一致的顺序并且易于被个人或计算机程序访问和使用的数据。

结构化数据通常存储在定义明确的模式中,例如数据库。它通常是带有列和行的表格,清楚地定义了其属性。

SQL(结构化查询语言)通常用于管理存储在数据库中的结构化数据。

结构化数据的特点:

  • 数据符合数据模型并具有易于识别的结构
  • 数据以行和列的形式存储
    示例:数据库
  • 数据组织良好,因此明确了解数据的定义、格式和含义
  • 数据驻留在记录或文件中的固定字段中
  • 相似的实体组合在一起形成关系或类
  • 同一组中的实体具有相同的属性
  • 易于访问和查询,因此数据可以很容易地被其他程序使用
  • 数据元素可寻址,分析和处理效率高

结构化数据的来源:

  • SQL 数据库
  • 电子表格,例如 Excel
  • OLTP 系统
  • 在线表格
  • GPS 或 RFID 标签等传感器
  • 网络和 Web 服务器日志
  • 医疗设备

结构化数据的优点:

  • 结构化数据具有明确定义的结构,有助于轻松存储和访问数据
  • 可以根据文本字符串和属性对数据进行索引。这使得搜索操作无忧
  • 数据挖掘很容易,即可以很容易地从数据中提取知识
  • 由于数据结构良好,更新和删除等操作很容易
  • 可以轻松进行数据仓库等商业智能操作
  • 可轻松扩展,以防数据增加
  • 确保数据安全很容易

注:结构化数据仅占数据的 20% 左右,但由于其高度的组织性和性能使其成为大数据的基础

要阅读结构化、半结构化和非结构化数据之间的差异,请参阅以下文章 –

  • 结构化、半结构化和非结构化数据的区别