📅  最后修改于: 2023-12-03 15:25:14.473000             🧑  作者: Mango
Pandas 是一个数据分析库,它提供了强大的数据结构,如 Pandas 系列,它是一种类似于 NumPy 数组的一维数组,但可以由自定义索引标签标识。
在很多情况下,我们需要将 NumPy 数组转换为 Pandas 系列。在接下来的内容中,我们将详细介绍如何进行这个过程。
我们可以使用 pandas.Series (data=[ ], index=[ ])
函数来创建一个 Pandas 系列对象。其中,data
是一个数组,它可以是标量值,Python 列表,NumPy 数组或 Pandas 系列。index
是一个可选参数,它可以是一组轴标签。如果没有提供索引,则将创建默认的索引。
import numpy as np
import pandas as pd
# 创建一个 NumPy 数组
arr = np.array([10, 20, 30, 40, 50])
# 将 NumPy 数组转换为 Pandas 系列
s = pd.Series(data=arr)
# 打印 Pandas 系列
print(s)
输出结果:
0 10
1 20
2 30
3 40
4 50
dtype: int64
我们可以使用 index
参数指定自定义索引标签。
import numpy as np
import pandas as pd
# 创建一个 NumPy 数组
arr = np.array([10, 20, 30, 40, 50])
# 将 NumPy 数组转换为 Pandas 系列,并使用自定义索引标签
s = pd.Series(data=arr, index=['a', 'b', 'c', 'd', 'e'])
# 打印 Pandas 系列
print(s)
输出结果:
a 10
b 20
c 30
d 40
e 50
dtype: int64
我们可以使用 pd.DataFrame (data= )
函数创建一个 Pandas 数据帧对象,从中获取 Pandas 系列。
import numpy as np
import pandas as pd
# 创建一个 2D NumPy 数组
arr = np.array([[10, 20, 30], [40, 50, 60]])
# 创建一个 Pandas 数据帧对象
df = pd.DataFrame(data=arr, columns=['A', 'B', 'C'])
# 从 Pandas 数据帧中获取列 A 的 Pandas 系列
s = df['A']
# 打印 Pandas 系列
print(s)
输出结果:
0 10
1 40
Name: A, dtype: int64
我们可以使用条件表达式创建一个布尔值的 NumPy 数组,然后将其转换为 Pandas 系列。
import numpy as np
import pandas as pd
# 创建一个布尔值的 NumPy 数组
arr = np.array([True, False, True, False, True])
# 将布尔值的 NumPy 数组转换为 Pandas 系列
s = pd.Series(data=arr)
# 打印 Pandas 系列
print(s)
输出结果:
0 True
1 False
2 True
3 False
4 True
dtype: bool
我们可以使用字典创建一个 Pandas 系列,其中字典的键将用作索引标签。
import pandas as pd
# 创建一个字典
data = {'a': 10, 'b': 20, 'c': 30, 'd': 40, 'e': 50}
# 将字典转换为 Pandas 系列
s = pd.Series(data=data)
# 打印 Pandas 系列
print(s)
输出结果:
a 10
b 20
c 30
d 40
e 50
dtype: int64