📜  从 np 数组制作 pandas df - Python (1)

📅  最后修改于: 2023-12-03 15:36:14.527000             🧑  作者: Mango

从 np 数组制作 pandas df - Python

在数据分析和科学领域中,pandas 是一个非常流行的数据处理工具。在许多情况下,将 numpy 数组转换为 pandas 数据帧(df)是非常有用和必要的操作。在本文中,我们将讨论如何以最简单的方式从 numpy 数组创建 pandas 数据帧。

步骤 1: 导入 NumPy 和 pandas 库

我们首先需要在代码中导入 NumPy 和 pandas 库。

import numpy as np
import pandas as pd
步骤 2: 创建 NumPy 数组

我们需要先创建一个 NumPy 数组,这里我们将创建一个 3 行 3 列的随机数组。

arr = np.random.randn(3, 3)
print(arr)

输出:

[[-0.23862051 -0.31319382 -0.38035484]
 [ 0.96528267  0.55226546 -1.20040977]
 [ 0.8828226  -0.47184736 -0.46162695]]
步骤 3: 创建 pandas 数据帧

我们使用 pandas 库中的 DataFrame() 方法来将 numpy 数组转换为数据帧。

df = pd.DataFrame(arr)
print(df)

输出:

          0         1         2
0 -0.238621 -0.313194 -0.380355
1  0.965283  0.552265 -1.200410
2  0.882823 -0.471847 -0.461627

可以看到,我们现在已经成功地将 numpy 数组转换为 pandas 数据帧。

步骤 4: 添加行和列标签

pandas 数据帧有行和列标签,我们可以使用 index 和 columns 属性为其添加标签。

df = pd.DataFrame(arr, index=['row1', 'row2', 'row3'], columns=['col1', 'col2', 'col3'])
print(df)

输出:

          col1      col2      col3
row1 -0.238621 -0.313194 -0.380355
row2  0.965283  0.552265 -1.200410
row3  0.882823 -0.471847 -0.461627

我们现在已经成功地将 numpy 数组转换为带有行和列标签的 pandas 数据帧。

步骤 5: 将 pandas 数据帧保存到 csv 文件

我们可以使用 pandas 库中的 to_csv() 方法将 pandas 数据帧保存到 csv 文件。

df.to_csv('output.csv', index=False)

上述代码会将 pandas 数据帧保存为名为 output.csv 的 csv 文件,并在保存时去除行索引。

总结

在本教程中,我们学习了如何使用 NumPy 和 pandas 库将 numpy 数组转换为 pandas 数据帧。我们还学习了如何添加行和列标签以及将 pandas 数据帧保存为 csv 文件。