📜  数据分析-概述

📅  最后修改于: 2020-12-01 05:41:37             🧑  作者: Mango


数据分析是检查,清理,转换和建模数据的过程,目的是发现有用的信息,提出结论并支持决策

数据分析类型

存在几种数据分析技术,其涵盖具有各种名称的各个领域,例如商业,科学,社会科学等。主要的数据分析方法是-

  • 数据挖掘
  • 商业情报
  • 统计分析
  • 预测分析
  • 文字分析

数据挖掘

数据挖掘是对大量数据的分析,以提取以前未知,有趣的数据模式,异常数据和相关性。注意,目标是从大量数据中提取模式和知识,而不是数据本身。

数据挖掘分析涉及人工智能,机器学习,统计和数据库系统的交集处的计算机科学方法。

从数据挖掘中获得的模式可以视为输入数据的摘要,可以将其用于进一步的分析或由决策支持系统获得更准确的预测结果。

商业情报

商业智能技术和工具用于获取和转换大量非结构化业务数据,以帮助识别,开发和创造新的战略业务机会。

商业智能的目标是允许轻松解释大量数据以发现新机会。它有助于基于洞察力来实施有效的策略,从而为企业提供具有竞争力的市场优势和长期稳定性。

统计分析

统计是对数据的收集,分析,解释,表示和组织的研究。

在数据分析中,使用了两种主要的统计方法-

  • 描述性统计-在描述性统计中,使用诸如-

    • 均值,连续数据的标准偏差

    • 频率,分类数据百分比

  • 推论统计-它使用样本数据中的模式来得出有关所代表种群的推论或解释随机性。这些推论可以是-

    • 回答有关数据的是/否问题(假设检验)

    • 估计数据的数值特征(估计)

    • 描述数据中的关联(关联)

    • 在数据中建模关系(例如回归分析)

预测分析

Predictive Analytics使用统计模型来分析当前和历史数据,以对未来或其他未知事件进行预测(预测)。在业务中,预测分析用于识别有助于决策的风险和机会。

文字分析

文本分析(也称为文本挖掘或文本数据挖掘)是从文本中获取高质量信息的过程。文本挖掘通常涉及以下过程:构造输入文本,使用统计模式学习等方法在结构化数据中推导模式,最后评估和解释输出。

数据分析过程

统计学家约翰·图基(John Tukey)在1961年将“数据分析”定义为“分析数据的程序,解释此类程序结果的技术,计划数据收集以使其分析更容易,更精确或更准确的方式以及所有手段以及适用于分析数据的(数学)统计结果。”

因此,数据分析是一个从各种来源获取大型非结构化数据并将其转换为对以下有用的信息的过程:

  • 回答问题
  • 检验假设
  • 做决定
  • 反对理论

用Excel进行数据分析

Microsoft Excel提供了几种分析和解释数据的方法。数据可以来自各种来源。可以通过多种方式转换和格式化数据。可以使用相关的Excel命令,函数和工具进行分析-包括条件格式,范围,表格,文本函数,日期函数,时间函数,财务函数,小计,快速分析,公式审核,查询工具,假设分析,解算器,数据模型,PowerPivot,PowerView,PowerMap等

您将通过两个部分的Excel学习这些数据分析技术-

  • 使用Excel和
  • 使用Excel进行高级数据分析