📅  最后修改于: 2023-12-03 15:09:07.157000             🧑  作者: Mango
在数据科学和机器学习中,我们经常需要将字符串标签转换为数字形式,以便使用它们来训练模型。这篇文章将介绍如何使用 Python 中的 numpy 库将字符串标签转换为 numpy 数组。
在开始之前,我们需要导入 numpy 库。可以使用以下命令:
import numpy as np
假设我们有一个字符串标签数组,如下所示:
label_array = np.array(["cat", "dog", "cat", "bird", "bird", "dog"])
然后,我们需要创建一个标签字典,其中将每个字符串映射到相应的数字:
label_dict = {'cat': 0, 'dog': 1, 'bird': 2}
现在,我们可以使用 numpy.vectorize()
函数和我们的标签字典将字符串标签转换为数字数组:
label_to_num = np.vectorize(label_dict.get)(label_array)
最后,我们可以查看转换后的数字数组:
print(label_to_num)
输出:
[0 1 0 2 2 1]
这就是将字符串标签转换为 numpy 数组的过程。
在本篇文章中,我们介绍了如何使用 numpy 库将字符串标签转换为数字数组。这对于训练机器学习模型非常有用。