📅  最后修改于: 2023-12-03 15:07:55.147000             🧑  作者: Mango
Pandas 是一个 Python 数据分析库,它提供了数据结构和数据分析工具,使得数据处理更加方便和快捷。Pandas 中最基本的数据结构是 Series,它类似于一个数组或一维向量,在数据处理中使用非常广泛。
我们可以使用 Pandas 的 Series 方法来创建一个 Series 对象。Series 对象由两个数组组成,一个数组是数据的值,另一个数组是数据的索引。例如,我们可以创建一个包含整数的一维对象,如下所示:
import pandas as pd
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s)
输出结果如下:
0 1
1 2
2 3
3 4
4 5
dtype: int64
在上面的代码中,我们首先导入 Pandas 库,然后创建一个包含整数数据的列表,接着使用 pd.Series 方法来将其转换成一个 Pandas 中的 Series 对象。最后我们打印出这个对象,可以看到输出了一列数据。
在创建了 Series 对象之后,我们可以使用其属性和方法对其进行操作。下面是一些常用的 Series 对象的属性和方法:
例如,我们可以使用下面的代码来演示这些属性和方法:
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s.values)
print(s.index)
print(s.head())
print(s.tail())
print(s.describe())
print(s.mean())
print(s.median())
print(s.std())
输出结果如下:
[1 2 3 4 5]
RangeIndex(start=0, stop=5, step=1)
0 1
1 2
2 3
3 4
4 5
dtype: int64
0 1
1 2
2 3
3 4
4 5
dtype: int64
count 5.000000
mean 3.000000
std 1.581139
min 1.000000
25% 2.000000
50% 3.000000
75% 4.000000
max 5.000000
dtype: float64
3.0
3.0
1.5811388300841898
我们可以使用 Series 对象中的索引来修改和筛选其中的数据。下面是一些常用的方法:
例如,我们可以使用下面的代码来修改和筛选 Series 对象中的数据:
data = [1, 2, 3, 4, 5]
s = pd.Series(data)
print(s.loc[2])
print(s.iloc[2])
s[2] = 10
print(s)
print(s[1:3])
print(s[s > 2])
输出结果如下:
3
3
0 1
1 2
2 10
3 4
4 5
dtype: int64
1 2
2 10
dtype: int64
2 10
3 4
4 5
dtype: int64
Pandas 的 Series 对象是一个非常方便的数据结构,它可以用于存储一维数据,并提供了丰富的属性和方法来对数据进行操作。在数据处理和分析中,Pandas 很容易上手,威力非凡,是数据科学家不可或缺的工具之一。