结构化数据是符合数据模型、具有明确定义的结构、遵循一致的顺序并且易于被个人或计算机程序访问和使用的数据。
结构化数据通常存储在定义明确的模式中,例如数据库。它通常是带有列和行的表格,清楚地定义了其属性。
SQL(结构化查询语言)通常用于管理存储在数据库中的结构化数据。
结构化数据的特点:
- 数据符合数据模型并具有易于识别的结构
- 数据以行和列的形式存储
示例:数据库 - 数据组织良好,因此明确了解数据的定义、格式和含义
- 数据驻留在记录或文件中的固定字段中
- 相似的实体组合在一起形成关系或类
- 同一组中的实体具有相同的属性
- 易于访问和查询,因此数据可以很容易地被其他程序使用
- 数据元素可寻址,分析和处理效率高
结构化数据的来源:
- SQL 数据库
- 电子表格,例如 Excel
- OLTP 系统
- 在线表格
- GPS 或 RFID 标签等传感器
- 网络和 Web 服务器日志
- 医疗设备
结构化数据的优点:
- 结构化数据具有明确定义的结构,有助于轻松存储和访问数据
- 可以根据文本字符串和属性对数据进行索引。这使得搜索操作无忧
- 数据挖掘很容易,即可以很容易地从数据中提取知识
- 由于数据结构良好,更新和删除等操作很容易
- 可以轻松进行数据仓库等商业智能操作
- 可轻松扩展,以防数据增加
- 确保数据安全很容易
注:结构化数据仅占数据的 20% 左右,但由于其高度的组织性和性能使其成为大数据的基础
要阅读结构化、半结构化和非结构化数据之间的差异,请参阅以下文章 –
- 结构化、半结构化和非结构化数据的区别