📜  如何在 PyBrain 中使用 sklearn 导入数据集

📅  最后修改于: 2022-05-13 01:54:46.710000             🧑  作者: Mango

如何在 PyBrain 中使用 sklearn 导入数据集

在本文中,我们将讨论如何在 PyBrain 中使用 sklearn 导入数据集

数据集:数据集定义为可用于在网络上测试、验证和训练的数据集。在将其与数组进行比较时,数据集被认为更灵活且易于使用。数据集类似于二维数组。数据集用于执行机器学习任务。

我们系统中需要安装的库有:

  • sklearn
  • pybrain

安装这些库的语法:

pip install sklearn pybrain

示例 1:

在这个例子中,首先我们从 sklearn 库中导入了包数据集,从 pybrain.datasets 中导入了 ClassificationDataset。然后我们加载了数字数据集。在下一条语句中,我们将定义特征变量和目标变量。然后我们通过定义 64 个输入、1 个输出和 15 个类来创建分类数据集模型。然后,我们将数据附加到创建的数据集。

Python3
# Importing libraries
from sklearn import datasets
from pybrain.datasets import ClassificationDataSet
  
# Loading digits
loaded_digits = datasets.load_digits()
  
# Set data items
x_data, y_data = loaded_digits.data, loaded_digits.target
  
# Classification dataset
dataset = ClassificationDataSet(64, 1, nb_classes=15)
  
# Iterate over the length of X
for i in range(len(x_data)):
    dataset.addSample(x_data[i], y_data[i])
  
# Print the dataset
print(dataset)


Python3
# Importing libraries
from sklearn import datasets
from pybrain.datasets import ClassificationDataSet
  
# Loading iris
loaded_digits = datasets.load_iris()
  
# Setting data fields
x_data, y_data = loaded_digits.data, loaded_digits.target
  
# Creating a ClassificationDataset
dataset = ClassificationDataSet(4, 1, nb_classes=2)
  
# Iterating over the length of x_data
for i in range(len(x_data)):
    dataset.addSample(x_data[i], y_data[i])
  
# Print the dataset
print(dataset)


输出:

示例 2:

在这个例子中,首先我们从 sklearn 库中导入了包数据集,从 pybrain.datasets 中导入了 ClassificationDataset。然后我们加载了 iris 数据集。在下一条语句中,我们将定义特征变量和目标变量。然后我们通过定义 4 个输入、1 个输出和 2 个类来创建分类数据集模型。然后,我们将数据附加到创建的数据集。

Python3

# Importing libraries
from sklearn import datasets
from pybrain.datasets import ClassificationDataSet
  
# Loading iris
loaded_digits = datasets.load_iris()
  
# Setting data fields
x_data, y_data = loaded_digits.data, loaded_digits.target
  
# Creating a ClassificationDataset
dataset = ClassificationDataSet(4, 1, nb_classes=2)
  
# Iterating over the length of x_data
for i in range(len(x_data)):
    dataset.addSample(x_data[i], y_data[i])
  
# Print the dataset
print(dataset)

输出: