📅  最后修改于: 2023-12-03 15:33:23.566000             🧑  作者: Mango
to_numpy()
方法使我们能够将 Pandas DataFrame 转换为 Numpy 数组。这是一个非常有用的功能,特别是在使用 Scikit-Learn 等几乎所有机器学习库时,因为它们几乎都需要 NumPy 数组作为输入。
以下是将 Pandas DataFrame 转换为 Numpy 数组的语法:
dataframe.to_numpy()
其中 dataframe
是要转换为 Numpy 数组的 Pandas DataFrame 对象。
假设我们有以下的 Pandas DataFrame df
:
>>> import pandas as pd
>>> import numpy as np
>>> df = pd.DataFrame({'name': ['John', 'Alice', 'Bob'], 'age': [24, 28, 22]})
>>> print(df)
name age
0 John 24
1 Alice 28
2 Bob 22
然后我们可以使用 to_numpy()
方法将 df
转换为 Numpy 数组:
>>> np_array = df.to_numpy()
>>> print(np_array)
array([['John', 24],
['Alice', 28],
['Bob', 22]], dtype=object)
请注意,在这个例子中,我们没有指定 to_numpy()
的任何参数。因此,结果数组的 dtype 是 object
,因为输入 DataFrame 包含字符串类型。
但是,如果 DataFrame 包含其他类型(例如 float 或 int),则转换出的数组的 dtype 将相应地更改。
to_numpy()
方法是将 Pandas DataFrame 转换为 NumPy 数组的一种简单方法。我们可以使用该方法将 DataFrame 转换为 NumPy 数组,并在 Scikit-Learn 等 ML 库中使用它们。