📜  从 Numpy 数组创建 Pandas DataFrame 并指定索引列和列标题(1)

📅  最后修改于: 2023-12-03 15:36:14.548000             🧑  作者: Mango

从 Numpy 数组创建 Pandas DataFrame 并指定索引列和列标题

在数据分析领域中,常常需要使用 Pandas 进行数据处理和分析。其中最常用的数据结构是 DataFrame。

Pandas 的 DataFrame 可以通过多种方式创建,包括从 CSV 文件、数据库或 Numpy 数组中创建。本文将介绍如何从 Numpy 数组创建 Pandas DataFrame 并指定索引列和列标题。

准备工作

首先,需要安装并导入 Pandas 和 Numpy 库。

import pandas as pd
import numpy as np

接下来,创建一个 Numpy 数组来演示如何创建 DataFrame。

data = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

这个数组包含了 3 行 3 列的整数数据。

从 Numpy 数组创建 DataFrame

使用 Pandas 的 DataFrame() 函数可以从 Numpy 数组创建 DataFrame。

df = pd.DataFrame(data)

这个语句将创建一个包含所有数据的 DataFrame。默认情况下,Pandas 会用从 0 开始的整数列和行号索引 DataFrame。

输出 DataFrame:

   0  1  2
0  1  2  3
1  4  5  6
2  7  8  9
指定索引列和列标题

DataFrame 的列和行号可以设定为标题,这些标题可以从 Numpy 数组中获取。例如,可以使用下面的代码将第一列设定为索引列,第一行设定为列标题。

df = pd.DataFrame(data, index=['a', 'b', 'c'], columns=['one', 'two', 'three'])

输出 DataFrame:

   one  two  three
a    1    2      3
b    4    5      6
c    7    8      9
总结

以上就是从 Numpy 数组创建 Pandas DataFrame 并指定索引列和列标题的方法。通过这种方式,可以更好地控制和管理 DataFrame 的结构和属性。