如何使用 PyBrain 创建数据集?
在本文中,我们将了解如何使用 PyBrain 创建数据集。
数据集
数据集是专门用于在网络上进行测试、验证和训练的数据。 PyBrain 为我们提供了更灵活的数据结构,而不是数组的麻烦,使用它可以很容易地处理数据。数据集可以显示为命名二维数组的集合。在机器学习中,为了处理每项任务,它都有特殊的数据集。
PyBrain
它是基于 Python 的强化学习、人工智能的首字母缩写词。在Python中,它是一个模块化的机器学习库。它为执行机器学习任务提供了灵活的算法。它还为测试算法提供了良好的环境。本文重点介绍使用 PyBrain 创建数据集。
使用 PyBrain 创建数据集
要使用 PyBrain 创建数据集,需要使用 pybrain.datasets(PyBrain 的数据集包)。此数据集包提供对数据集类的支持。例如,它提供了对 SequentialDataset、SupervisedDataset、ClassificationDataSet 的支持。要使用的数据集依赖于程序员想要实现的机器学习任务。在本例中,我们将使用 SupervisedDataset。 SupervisedDataset 数据集具有以下语法,
Syntax: SupervisedDataSet(input, target)
Where,
- input: A data structure (for example, 2-d array)
- target: The output
例子:
在此示例中,输入的大小等于 2,目标的大小等于 1。
Python3
# Python program to create a dataset
# using PyBrain
# Importing SupervisedDataSet from
# pybrain.datasets
from pybrain.datasets import SupervisedDataSet
# Creating SupervisedDataSet
supervised_dataset = SupervisedDataSet(2, 1)
# Print
print(dataSet)
Python3
# Python program to create a dataset
# using PyBrain
# Importing supervised dataset from
# pybrain.datasets
from pybrain.datasets import SupervisedDataSet
# Creating dataSet
supervised_dataset = SupervisedDataSet(2, 1)
# xor table
xor_table = [
[(0, 0), (0,)],
[(0, 1), (1,)],
[(1, 0), (1,)],
[(1, 1), (0,)],
]
# Adding sample from xor_table into
# supervised_dataset
for input, target in xor_table:
supervised_dataset.addSample(input, target)
# Printing the input
print("input: \n", supervised_dataset['input'])
print("")
# Printing the target
print("target: \n", supervised_dataset['target'])
输出:
将数据添加到数据集
在这一部分中,我们将讨论如何将样本数据添加到我们的数据集中。
例子:
在这个例子中,我们正在创建一个 XOR 真值表。传递的输入就像一个二维数组,我们得到的输出是 1。输入用于大小的目的,目标充当输出(等于 1)。所以传递给我们数据集的输入是 2,1。 A B A XOR B 0 0 0 1 0 1 0 1 1 1 1 0
Python3
# Python program to create a dataset
# using PyBrain
# Importing supervised dataset from
# pybrain.datasets
from pybrain.datasets import SupervisedDataSet
# Creating dataSet
supervised_dataset = SupervisedDataSet(2, 1)
# xor table
xor_table = [
[(0, 0), (0,)],
[(0, 1), (1,)],
[(1, 0), (1,)],
[(1, 1), (0,)],
]
# Adding sample from xor_table into
# supervised_dataset
for input, target in xor_table:
supervised_dataset.addSample(input, target)
# Printing the input
print("input: \n", supervised_dataset['input'])
print("")
# Printing the target
print("target: \n", supervised_dataset['target'])
输出: