📜  什么是维卡? -指导点

📅  最后修改于: 2020-11-28 14:19:07             🧑  作者: Mango


WEKA-一个开源软件,提供了用于数据预处理,几种机器学习算法的实现以及可视化工具的工具,以便您可以开发机器学习技术并将其应用于实际数据挖掘问题。下图总结了WEKA提供的服务-

Weka总结

如果您观察到图像流的开始,您将了解,处理大数据要经历许多阶段才能使其适合机器学习-

首先,您将从从现场收集的原始数据开始。该数据可能包含几个空值和不相关的字段。您可以使用WEKA中提供的数据预处理工具来清理数据。

然后,将预处理的数据保存在本地存储中以应用ML算法。

接下来,根据您尝试开发的ML模型的类型,您将选择诸如Classify,ClusterAssociate之类的选项之一。通过“属性选择”,可以自动选择要素以创建简化的数据集。

请注意,在每个类别下,WEKA提供了几种算法的实现。您将选择一种算法,设置所需的参数,然后在数据集上运行它。

然后,WEKA将为您提供模型处理的统计输出。它为您提供了可视化工具来检查数据。

各种模型可以应用于同一数据集。然后,您可以比较不同模型的输出,并选择满足您目的的最佳模型。

因此,使用WEKA可以整体上更快地开发机器学习模型。

现在我们已经了解了WEKA是什么以及它的作用,在下一章中,让我们学习如何在本地计算机上安装WEKA。