📅  最后修改于: 2020-12-04 02:18:49             🧑  作者: Mango
大数据包含大量未由传统数据存储或处理单元处理的数据。许多跨国公司使用它来处理许多组织的数据和业务。复制之前,每天的数据流将超过150艾字节。
大数据有五个v可以解释这些特征。
大数据本身就是一个巨大的名称。大数据是每天从许多来源(例如业务流程,机器,社交媒体平台,网络,人机交互等等)中生成的海量数据。
Facebook可以产生大约10亿条消息,是记录“赞”按钮的45亿次,每天上传超过3.5亿条新帖子。大数据技术可以处理大量数据。
从不同来源收集的大数据可以是结构化,非结构化和半结构化的。过去只能从数据库和工作表中收集数据,但是如今,数据将以数组形式出现,即PDF,电子邮件,音频,SM帖子,照片,视频等。
数据分类如下:
示例:Web服务器日志,即日志文件是由包含活动列表的某些服务器创建和维护的。
准确性意味着多少数据是可靠的。它有很多方法可以过滤或转换数据。准确性是能够有效处理和管理数据的过程。大数据在业务发展中也至关重要。
例如, Facebook带有标签的帖子。
价值是大数据的基本特征。这不是我们处理或存储的数据。我们存储,处理和分析这些宝贵而可靠的数据。
与其他人相比,速度起着重要作用。速度创造了实时创建数据的速度。它包含传入数据集速度,变化率和活动突发的链接。大数据的主要方面是快速提供要求苛刻的数据。
大数据速度处理来自应用程序日志,业务流程,网络和社交媒体站点,传感器,移动设备等来源的数据流速度。