📜  Weka-文件格式

📅  最后修改于: 2020-11-28 14:20:25             🧑  作者: Mango


WEKA支持多种文件格式的数据。这是完整列表-

  • 阿尔夫
  • arff.gz
  • bsi
  • CSV
  • t
  • 数据
  • json
  • json.gz
  • 的libsvm
  • 名字
  • xrff
  • xrff.gz

它支持的文件类型在屏幕底部的下拉列表框中列出。这显示在下面的屏幕快照中。

下拉列表

您会注意到,它支持多种格式,包括CSV和JSON。默认文件类型为Arff。

Arff格式

Arff文件包含两个部分-标头和数据。

  • 标题描述属性类型。
  • 数据部分包含逗号分隔的数据列表。

作为Arff格式的示例,从WEKA示例数据库加载的天气数据文件如下所示-

样本数据库

从屏幕截图中,您可以推断出以下几点-

  • @relation标记定义数据库的名称。

  • @attribute标记定义属性。

  • @data标记开始数据行列表,每个数据行包含逗号分隔的字段。

  • 属性可以采用标称值,如此处所示的Outlook一样-

@attribute outlook (sunny, overcast, rainy)
  • 在这种情况下,属性可以采用实数值-

@attribute temperature real
  • 您还可以设置一个名为play的Target或Class变量,如下所示-

@attribute play (yes, no)
  • 目标假设两个标称值是或否。

其他格式

资源管理器可以以前面提到的任何格式加载数据。由于arff是WEKA中的首选格式,因此您可以从任何格式加载数据并将其保存为arff格式以供以后使用。预处理数据后,只需将其保存为arff格式以进行进一步分析。

现在您已经了解了如何将数据加载到WEKA中,在下一章中,您将学习如何预处理数据。