📝 Weka教程
14篇技术文档📅  最后修改于: 2020-11-28 14:18:28        🧑  作者: Mango
Weka是一款功能全面的软件,可让您预处理大数据,对大数据应用不同的机器学习算法并比较各种输出。该软件使使用大数据和使用机器学习算法训练机器变得容易。本教程将指导您使用WEKA来满足上述所有要求。本教程非常适合那些热衷于学习Weka的机器学习爱好者。它满足了机器学习的初学者和专家的学习需求。先决条件本教程是为假定具有数据挖掘和机器学习算法基础知识的读者编写的。如果您不熟悉这些主题,我们建议您在开始...
📅  最后修改于: 2020-11-28 14:18:48        🧑  作者: Mango
任何机器学习应用程序的基础都是数据-不仅是少量数据,而且是巨大的数据,在当前术语中被称为大数据。要训练机器分析大数据,您需要对数据进行一些考虑-数据必须干净。它不应包含空值。此外,并非数据表中的所有列都将对您尝试实现的分析类型有用。在将数据输入到机器学习算法之前,必须删除机器学习术语中不相关的数据列或“功能”。简而言之,您的大数据需要进行大量预处理才能用于机器学习。数据准备好后,您将应用各种机器学...
📅  最后修改于: 2020-11-28 14:19:07        🧑  作者: Mango
WEKA-一个开源软件,提供了用于数据预处理,几种机器学习算法的实现以及可视化工具的工具,以便您可以开发机器学习技术并将其应用于实际数据挖掘问题。下图总结了WEKA提供的服务-如果您观察到图像流的开始,您将了解,处理大数据要经历许多阶段才能使其适合机器学习-首先,您将从从现场收集的原始数据开始。该数据可能包含几个空值和不相关的字段。您可以使用WEKA中提供的数据预处理工具来清理数据。然后,将预处理...
📅  最后修改于: 2020-11-28 14:19:23        🧑  作者: Mango
要在您的机器上安装WEKA,请访问WEKA的官方网站并下载安装文件。 WEKA支持在Windows,Mac OS X和Linux上安装。您只需要按照此页面上的说明为您的操作系统安装WEKA。在Mac上安装的步骤如下-下载Mac安装文件。双击下载的weka-3-8-3-corretto-jvm.dmg文件。成功安装后,您将看到以下屏幕。单击weak-3-8-3-corretto-jvm图标以启动We...
📅  最后修改于: 2020-11-28 14:19:44        🧑  作者: Mango
在本章中,让我们研究资源管理器提供的用于处理大数据的各种功能。当您单击“应用程序”选择器中的“资源管理器”按钮时,它将打开以下屏幕:在顶部,您将看到几个标签,如下所示-预处理分类簇关联选择属性可视化在这些选项卡下,有几种预先实现的机器学习算法。现在让我们详细研究它们。预处理选项卡最初,在打开资源管理器时,仅启用“预处理”选项卡。机器学习的第一步是预处理数据。因此,在“预处理”选项中,您将选择数据文...
📅  最后修改于: 2020-11-28 14:20:05        🧑  作者: Mango
在本章中,我们从用于预处理数据的第一个选项卡开始。这对于您将应用于数据以建立模型的所有算法都是通用的,并且是WEKA中所有后续操作的通用步骤。为了使机器学习算法具有可接受的准确性,必须首先清除数据很重要。这是因为从该字段收集的原始数据可能包含空值,不相关的列等。在本章中,您将学习如何预处理原始数据并创建干净,有意义的数据集以备将来使用。首先,您将学习将数据文件加载到WEKA资源管理器中。可以从以下...
📅  最后修改于: 2020-11-28 14:20:25        🧑  作者: Mango
WEKA支持多种文件格式的数据。这是完整列表-阿尔夫arff.gzbsiCSVt数据jsonjson.gz的libsvm米名字xrffxrff.gz它支持的文件类型在屏幕底部的下拉列表框中列出。这显示在下面的屏幕快照中。您会注意到,它支持多种格式,包括CSV和JSON。默认文件类型为Arff。Arff格式Arff文件包含两个部分-标头和数据。标题描述属性类型。数据部分包含逗号分隔的数据列表。作为A...
📅  最后修改于: 2020-11-28 14:20:56        🧑  作者: Mango
从该字段收集的数据包含许多不想要的东西,从而导致错误的分析。例如,数据可能包含空字段,它可能包含与当前分析无关的列,依此类推。因此,必须对数据进行预处理才能满足您要查找的分析类型的要求。这是在预处理模块中完成的。为了演示预处理中的可用功能,我们将使用安装中提供的Weather数据库。使用“预处理”标签下的“打开文件…”选项,选择weather-nominal.arff文件。当您打开文件时,您的屏幕...
📅  最后修改于: 2020-11-28 14:21:28        🧑  作者: Mango
许多机器学习应用与分类有关。例如,您可能希望将肿瘤分类为恶性或良性。您可能要根据天气情况决定是否玩户外游戏。通常,此决定取决于天气的几个特征/条件。因此,您可能更喜欢使用树分类器来决定是否玩游戏。在本章中,我们将学习如何在天气数据上建立这样的树分类器,以决定比赛条件。设置测试数据我们将使用上一课中的预处理天气数据文件。使用“预处理”选项卡下的“打开文件…”选项打开保存的文件,单击“分类”选项卡,您...
📅  最后修改于: 2020-11-28 14:21:59        🧑  作者: Mango
聚类算法在整个数据集中查找相似实例的组。 WEKA支持多种聚类算法,例如EM,FilteredClusterer,HierarchicalClusterer,SimpleKMeans等。您应该完全理解这些算法以充分利用WEKA功能。与分类一样,WEKA允许您以图形方式可视化检测到的群集。为了演示聚类,我们将使用提供的虹膜数据库。数据集包含三个类别,每个类别有50个实例。每个类别都指一种虹膜植物。加...
📅  最后修改于: 2020-11-28 14:22:18        🧑  作者: Mango
据观察,购买啤酒的人也同时购买尿布。那是一起购买啤酒和尿布的协会。尽管这似乎不太令人信服,但该关联规则是从大型超市数据库中提取的。同样,花生酱和面包之间可能存在关联。找到这样的关联对超市来说至关重要,因为它们会在啤酒旁边存放尿布,以便客户可以轻松找到这两种商品,从而增加了超市的销售量。Apriori算法就是ML中的一种这样的算法,它找出可能的关联并创建关联规则。 WEKA提供了Apriori算法的...
📅  最后修改于: 2020-11-28 14:22:46        🧑  作者: Mango
当数据库包含大量属性时,将有几个属性在您当前正在寻找的分析中不重要。因此,从数据集中删除不需要的属性成为开发良好的机器学习模型的重要任务。您可以目视检查整个数据集,并确定不相关的属性。对于包含大量属性的数据库(例如您在上一课中看到的超级市场案例)而言,这可能是一项艰巨的任务。幸运的是,WEKA提供了用于功能选择的自动化工具。本章将在包含大量属性的数据库上演示此功能。加载数据中在WEKA资源管理器的...
📅  最后修改于: 2020-11-28 14:22:59        🧑  作者: Mango
以下资源包含有关Weka的其他信息。请使用它们来获得有关此方面的更深入的知识。关于Weka的有用链接Weka @ Wikipedia-Weka,其历史和其他各种术语已用简单的语言进行了解释。要在此页面上注册您的网站,请发送电子邮件至...
📅  最后修改于: 2020-11-28 14:23:12        🧑  作者: Mango
Weka是一款功能全面的软件,可让您预处理大数据,对大数据应用不同的机器学习算法并比较各种输出。该软件使使用大数据和使用机器学习算法训练机器变得容易。本教程将指导您使用WEKA来满足上述所有要求。...