📜  Weka-加载数据

📅  最后修改于: 2020-11-28 14:20:05             🧑  作者: Mango


在本章中,我们从用于预处理数据的第一个选项卡开始。这对于您将应用于数据以建立模型的所有算法都是通用的,并且是WEKA中所有后续操作的通用步骤。

为了使机器学习算法具有可接受的准确性,必须首先清除数据很重要。这是因为从该字段收集的原始数据可能包含空值,不相关的列等。

在本章中,您将学习如何预处理原始数据并创建干净,有意义的数据集以备将来使用。

首先,您将学习将数据文件加载到WEKA资源管理器中。可以从以下来源加载数据-

  • 本地文件系统
  • 网页
  • 数据库

在本章中,我们将详细介绍加载数据的所有三个选项。

从本地文件系统加载数据

在上一课学习的机器学习选项卡下,您会发现以下三个按钮-

  • 打开文件 …
  • 开启网址…
  • 打开数据库…

单击打开文件…按钮。目录导航器窗口打开,如以下屏幕所示:

本地文件系统

现在,导航到存储数据文件的文件夹。 WEKA安装附带了许多示例数据库供您进行实验。这些在WEKA安装的数据文件夹中可用。

出于学习目的,请从此文件夹中选择任何数据文件。该文件的内容将在WEKA环境中加载。我们很快将学习如何检查和处理此加载的数据。在此之前,让我们看一下如何从Web加载数据文件。

从Web加载数据

单击“打开URL …”按钮后,您将看到如下窗口:

从Web加载数据

我们将通过公共URL打开文件。在弹出框中输入以下URL-

https://storm.cis.fordham.edu/~gweiss/data-mining/weka-data/weather.nominal.arff

您可以指定存储数据的任何其他URL。资源管理器会将数据从远程站点加载到其环境中。

从数据库加载数据

单击“打开数据库…”按钮后,您将看到如下窗口:

从Db加载数据

将连接字符串设置为数据库,设置查询以选择数据,处理查询并将所选记录加载到WEKA中。