📜  Pandas Dataframe.to_numpy() - 将数据帧转换为 Numpy 数组(1)

📅  最后修改于: 2023-12-03 15:33:23.566000             🧑  作者: Mango

Pandas Dataframe.to_numpy() - 将数据帧转换为 Numpy 数组

to_numpy() 方法使我们能够将 Pandas DataFrame 转换为 Numpy 数组。这是一个非常有用的功能,特别是在使用 Scikit-Learn 等几乎所有机器学习库时,因为它们几乎都需要 NumPy 数组作为输入。

语法

以下是将 Pandas DataFrame 转换为 Numpy 数组的语法:

dataframe.to_numpy()

其中 dataframe 是要转换为 Numpy 数组的 Pandas DataFrame 对象。

示例

假设我们有以下的 Pandas DataFrame df:

>>> import pandas as pd
>>> import numpy as np

>>> df = pd.DataFrame({'name': ['John', 'Alice', 'Bob'], 'age': [24, 28, 22]})
>>> print(df)
    name  age
0   John   24
1  Alice   28
2    Bob   22

然后我们可以使用 to_numpy() 方法将 df 转换为 Numpy 数组:

>>> np_array = df.to_numpy()
>>> print(np_array)
array([['John', 24],
       ['Alice', 28],
       ['Bob', 22]], dtype=object)

请注意,在这个例子中,我们没有指定 to_numpy() 的任何参数。因此,结果数组的 dtype 是 object,因为输入 DataFrame 包含字符串类型。

但是,如果 DataFrame 包含其他类型(例如 float 或 int),则转换出的数组的 dtype 将相应地更改。

总结

to_numpy() 方法是将 Pandas DataFrame 转换为 NumPy 数组的一种简单方法。我们可以使用该方法将 DataFrame 转换为 NumPy 数组,并在 Scikit-Learn 等 ML 库中使用它们。