📜  Python Pandas-索引和选择数据(1)

📅  最后修改于: 2023-12-03 15:18:57.885000             🧑  作者: Mango

Python Pandas-索引和选择数据

Pandas是Python数据分析库中非常重要的一部分,该库提供了一系列灵活高效的数据集结构,能够帮助用户完成各种数据处理任务。

索引

Pandas中最基本的数据结构是Series和DataFrame。其中Series是由一组数据以及一组与之相关的标签组成的,即索引;DataFrame则是由多个Series构成的。因此,在Pandas中索引的基本概念是Series和DataFrame的索引。可以使用以下方法为DataFrame和Series创建索引:

import pandas as pd
import numpy as np

# 构建Series对象
s = pd.Series(np.random.randn(5), index=['a', 'b', 'c', 'd', 'e'])
print(s)

输出:

a   -0.169609
b   -0.484674
c    0.349744
d   -0.636880
e   -2.541930
dtype: float64

在创建Series对象时,可以通过传递列表或数组来创建索引。

# 构建DataFrame对象
df = pd.DataFrame(np.random.randn(3, 4), index=['a', 'b', 'c'], columns=['A', 'B', 'C', 'D'])
print(df)

输出:

          A         B         C         D
a -1.430320 -0.427732 -0.245543 -0.297252
b -0.413986  1.091267 -0.258481  0.949214
c  0.111595  0.350074  1.069873 -0.592256

在创建DataFrame对象时,可以通过传递字典来创建索引。字典的键是每一列的列名,而值则是创建每一列的数据。

Pandas还提供了一些其他索引方式,例如:

# 使用loc方法进行索引
print(df.loc['a':'b', ['A', 'B']])

输出:

          A         B
a -1.430320 -0.427732
b -0.413986  1.091267
选择数据

在Pandas中,可以使用以下方法选择数据:

import pandas as pd
import numpy as np

# 构建DataFrame对象
df = pd.DataFrame(np.random.randn(3, 4), index=['a', 'b', 'c'], columns=['A', 'B', 'C', 'D'])

# 通过列名选择列
print(df['A'])

# 通过标签选择指定区域
print(df.loc['a':'b', ['A', 'B']])

# 通过位置选择指定行和列
print(df.iloc[1:3, 0:2])

# 通过条件选择指定行和列
print(df[df.A > 0])

输出:

a   -1.759719
b   -0.339807
c    1.569838
Name: A, dtype: float64
          A         B
a -1.759719 -0.434461
b -0.339807  1.582520
          A         B
b -0.339807  1.582520
c  1.569838 -1.037934
          A         B         C         D
c  1.569838 -1.037934  0.097542 -0.611456

在选择数据时,可以使用列名、标签、位置或条件进行选择。

感谢您的耐心阅读,希望本文可以帮助到您。