📜  在Python中使用 Pandas 创建并显示一个类似数组的一维对象(1)

📅  最后修改于: 2023-12-03 15:07:55.147000             🧑  作者: Mango

在 Python 中使用 Pandas 创建并显示一个类似数组的一维对象

Pandas 是一个 Python 数据分析库,它提供了数据结构和数据分析工具,使得数据处理更加方便和快捷。Pandas 中最基本的数据结构是 Series,它类似于一个数组或一维向量,在数据处理中使用非常广泛。

创建 Series 对象

我们可以使用 Pandas 的 Series 方法来创建一个 Series 对象。Series 对象由两个数组组成,一个数组是数据的值,另一个数组是数据的索引。例如,我们可以创建一个包含整数的一维对象,如下所示:

import pandas as pd

data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)

输出结果如下:

0    1
1    2
2    3
3    4
4    5
dtype: int64

在上面的代码中,我们首先导入 Pandas 库,然后创建一个包含整数数据的列表,接着使用 pd.Series 方法来将其转换成一个 Pandas 中的 Series 对象。最后我们打印出这个对象,可以看到输出了一列数据。

Series 对象的属性和方法

在创建了 Series 对象之后,我们可以使用其属性和方法对其进行操作。下面是一些常用的 Series 对象的属性和方法:

  • s.values: 获取 Series 对象中的值,返回一个 numpy.ndarray。
  • s.index: 获取 Series 对象中的索引,返回一个 pandas.Index 对象。
  • s.head(n): 查看前 n 个元素,默认为 5。
  • s.tail(n): 查看后 n 个元素,默认为 5。
  • s.describe(): 获取 Series 对象的描述性统计信息,包括均值、标准差、最小值、最大值等。
  • s.mean(): 获取 Series 对象的均值。
  • s.median(): 获取 Series 对象的中位数。
  • s.std(): 获取 Series 对象的标准差。

例如,我们可以使用下面的代码来演示这些属性和方法:

data = [1, 2, 3, 4, 5]
s = pd.Series(data)

print(s.values)
print(s.index)
print(s.head())
print(s.tail())
print(s.describe())
print(s.mean())
print(s.median())
print(s.std())

输出结果如下:

[1 2 3 4 5]
RangeIndex(start=0, stop=5, step=1)
0    1
1    2
2    3
3    4
4    5
dtype: int64
0    1
1    2
2    3
3    4
4    5
dtype: int64
count    5.000000
mean     3.000000
std      1.581139
min      1.000000
25%      2.000000
50%      3.000000
75%      4.000000
max      5.000000
dtype: float64
3.0
3.0
1.5811388300841898
修改和筛选 Series 对象中的数据

我们可以使用 Series 对象中的索引来修改和筛选其中的数据。下面是一些常用的方法:

  • s.loc[index]: 根据索引获取数据值。
  • s.iloc[n]: 根据位置获取数据值。
  • s[index] = value: 修改指定索引对应的数据值。
  • s[n:m]: 获取从位置 n 到 m-1 的数据切片。
  • s[s > 2]: 获取 Series 对象中大于 2 的数据。

例如,我们可以使用下面的代码来修改和筛选 Series 对象中的数据:

data = [1, 2, 3, 4, 5]
s = pd.Series(data)

print(s.loc[2])
print(s.iloc[2])
s[2] = 10
print(s)
print(s[1:3])
print(s[s > 2])

输出结果如下:

3
3
0     1
1     2
2    10
3     4
4     5
dtype: int64
1     2
2    10
dtype: int64
2    10
3     4
4     5
dtype: int64
结论

Pandas 的 Series 对象是一个非常方便的数据结构,它可以用于存储一维数据,并提供了丰富的属性和方法来对数据进行操作。在数据处理和分析中,Pandas 很容易上手,威力非凡,是数据科学家不可或缺的工具之一。