📜  Weka-简介

📅  最后修改于: 2020-11-28 14:18:48             🧑  作者: Mango


任何机器学习应用程序的基础都是数据-不仅是少量数据,而且是巨大的数据,在当前术语中被称为大数据

要训练机器分析大数据,您需要对数据进行一些考虑-

  • 数据必须干净。
  • 它不应包含空值。

此外,并非数据表中的所有列都将对您尝试实现的分析类型有用。在将数据输入到机器学习算法之前,必须删除机器学习术语中不相关的数据列或“功能”。

简而言之,您的大数据需要进行大量预处理才能用于机器学习。数据准备好后,您将应用各种机器学习算法,例如分类,回归,聚类等,以最终解决问题。

您应用的算法类型主要取决于您的领域知识。即使在同一类型内(例如分类),也可以使用几种算法。您可能想在同一个类下测试不同的算法,以构建有效的机器学习模型。这样做时,您可能希望对处理后的数据进行可视化,因此还需要可视化工具。

在接下来的章节中,您将了解Weka,该软件可以轻松完成上述所有任务,并让您舒适地处理大数据。