📜  pandas 应用返回数据框 - Python (1)

📅  最后修改于: 2023-12-03 15:03:29.876000             🧑  作者: Mango

pandas 应用返回数据框 - Python

在Python编程中,我们常常需要将数据存储在数据框中进行操作。pandas是Python数据科学领域中最常用的数据框框架,提供了一系列强大的处理数据的函数和方法。

pandas数据框

pandas中数据框可以看作是由一系列的 Series 组成,每一列是一个 Series。数据框的形式类似于电子表格,具有行和列的结构,而且支持不同类型的数据,如数字、字符串和日期等。

创建数据框

下面我们介绍一下如何创建一个简单的数据框。我们可以通过以下代码创建一个包含3行数据,3列数据的数据框。

import pandas as pd

data = {'名字':['张三', '李四', '王五'],
        '性别':['男', '男', '女'],
        '年龄':[21, 23, 20]}

df = pd.DataFrame(data)

print(df)

输出结果如下:

| | 名字 | 性别 | 年龄 | | --- | --- | --- | --- | | 0 | 张三 | 男 | 21 | | 1 | 李四 | 男 | 23 | | 2 | 王五 | 女 | 20 |

选择数据

我们可以使用lociloc函数来访问数据框中的特定行或列。如果我们想选择某一列,可以使用以下代码。

column = df['年龄']

print(column)

输出结果如下:

0    21
1    23
2    20
Name: 年龄, dtype: int64

如果我们想选择某一行,可以使用以下代码。

row = df.loc[0]

print(row)

输出结果如下:

名字    张三
性别     男
年龄    21
Name: 0, dtype: object
过滤数据

我们可以使用布尔索引来过滤数据。例如,如果我们想选择年龄大于20的人员,可以使用以下代码。

filtered = df[df['年龄'] > 20]

print(filtered)

输出结果如下:

| | 名字 | 性别 | 年龄 | | --- | --- | --- | --- | | 0 | 张三 | 男 | 21 | | 1 | 李四 | 男 | 23 |

修改数据

我们可以使用lociloc函数来修改数据框中的特定行或列的值。例如,如果我们想将某一行的年龄修改为25,可以使用以下代码。

df.loc[0, '年龄'] = 25

print(df)

输出结果如下:

| | 名字 | 性别 | 年龄 | | --- | --- | --- | --- | | 0 | 张三 | 男 | 25 | | 1 | 李四 | 男 | 23 | | 2 | 王五 | 女 | 20 |

删除数据

我们可以使用drop函数来删除数据框中的行或列。例如,如果我们想删除某一列,可以使用以下代码。

df = df.drop('性别', axis=1)

print(df)

输出结果如下:

| | 名字 | 年龄 | | --- | --- | --- | | 0 | 张三 | 25 | | 1 | 李四 | 23 | | 2 | 王五 | 20 |

总结

以上就是关于使用pandas创建、选择、过滤、修改和删除数据框的简单介绍。pandas提供了非常强大的数据框框架,可以方便地进行数据处理和操作。更多关于pandas的用法可以参考官方文档。