如何在 PyBrain 中使用 sklearn 导入数据集
在本文中,我们将讨论如何在 PyBrain 中使用 sklearn 导入数据集
数据集:数据集定义为可用于在网络上测试、验证和训练的数据集。在将其与数组进行比较时,数据集被认为更灵活且易于使用。数据集类似于二维数组。数据集用于执行机器学习任务。
我们系统中需要安装的库有:
- sklearn
- pybrain
安装这些库的语法:
pip install sklearn pybrain
示例 1:
在这个例子中,首先我们从 sklearn 库中导入了包数据集,从 pybrain.datasets 中导入了 ClassificationDataset。然后我们加载了数字数据集。在下一条语句中,我们将定义特征变量和目标变量。然后我们通过定义 64 个输入、1 个输出和 15 个类来创建分类数据集模型。然后,我们将数据附加到创建的数据集。
Python3
# Importing libraries
from sklearn import datasets
from pybrain.datasets import ClassificationDataSet
# Loading digits
loaded_digits = datasets.load_digits()
# Set data items
x_data, y_data = loaded_digits.data, loaded_digits.target
# Classification dataset
dataset = ClassificationDataSet(64, 1, nb_classes=15)
# Iterate over the length of X
for i in range(len(x_data)):
dataset.addSample(x_data[i], y_data[i])
# Print the dataset
print(dataset)
Python3
# Importing libraries
from sklearn import datasets
from pybrain.datasets import ClassificationDataSet
# Loading iris
loaded_digits = datasets.load_iris()
# Setting data fields
x_data, y_data = loaded_digits.data, loaded_digits.target
# Creating a ClassificationDataset
dataset = ClassificationDataSet(4, 1, nb_classes=2)
# Iterating over the length of x_data
for i in range(len(x_data)):
dataset.addSample(x_data[i], y_data[i])
# Print the dataset
print(dataset)
输出:
示例 2:
在这个例子中,首先我们从 sklearn 库中导入了包数据集,从 pybrain.datasets 中导入了 ClassificationDataset。然后我们加载了 iris 数据集。在下一条语句中,我们将定义特征变量和目标变量。然后我们通过定义 4 个输入、1 个输出和 2 个类来创建分类数据集模型。然后,我们将数据附加到创建的数据集。
Python3
# Importing libraries
from sklearn import datasets
from pybrain.datasets import ClassificationDataSet
# Loading iris
loaded_digits = datasets.load_iris()
# Setting data fields
x_data, y_data = loaded_digits.data, loaded_digits.target
# Creating a ClassificationDataset
dataset = ClassificationDataSet(4, 1, nb_classes=2)
# Iterating over the length of x_data
for i in range(len(x_data)):
dataset.addSample(x_data[i], y_data[i])
# Print the dataset
print(dataset)
输出: