📜  Python Pandas教程(1)

📅  最后修改于: 2023-12-03 14:46:02.064000             🧑  作者: Mango

Python Pandas教程

什么是Python Pandas?

Python Pandas是一个强大的数据处理和分析库,特别适用于处理结构化数据。它提供了丰富的数据结构和函数,能够使数据清洗、转换、分析和可视化变得更加简单和高效。

安装Python Pandas

要使用Python Pandas,首先需要安装它。可以通过以下命令来安装Pandas:

pip install pandas
导入Pandas

在使用Python Pandas之前,我们需要导入它。通常,我们使用如下方式导入Pandas:

import pandas as pd
主要功能
数据结构

Python Pandas提供了两种主要的数据结构:Series和DataFrame。

Series

Series是一维的数据结构,类似于带有标签的数组。它可以包含任何数据类型,例如整数、浮点数、字符串等。

# 创建一个Series
s = pd.Series([1, 3, 5, np.nan, 6, 8])

# 打印Series
print(s)

Output:

0    1.0
1    3.0
2    5.0
3    NaN
4    6.0
5    8.0
dtype: float64

DataFrame

DataFrame是二维的数据结构,类似于表格。它由一系列行和列组成,每列可以包含不同类型的数据。

# 创建一个DataFrame
data = {'Name': ['John', 'Emma', 'Alex'],
        'Age': [28, 24, 32],
        'City': ['New York', 'Paris', 'London']}

df = pd.DataFrame(data)

# 打印DataFrame
print(df)

Output:

   Name  Age      City
0  John   28  New York
1  Emma   24     Paris
2  Alex   32    London
数据操作

Python Pandas提供了各种数据操作功能,包括数据选择、过滤、排序、分组、合并等。

选择数据

# 选择某一列
column = df['Name']

# 选择多列
columns = df[['Name', 'Age']]

# 选择某一行
row = df.loc[0]

# 选择多行
rows = df.loc[0:1]

# 选择特定的行列
value = df.loc[0, 'Name']

过滤数据

# 根据条件过滤数据
filtered_df = df[df['Age'] > 25]

排序数据

# 按某一列排序数据
sorted_df = df.sort_values('Age')

分组数据

# 根据某一列分组数据
grouped_df = df.groupby('City').mean()

合并数据

# 合并两个DataFrame
merged_df = pd.concat([df1, df2])
数据可视化

Python Pandas也提供了数据可视化的功能。

# 绘制柱状图
df.plot.bar(x='Name', y='Age')

Markdown格式的介绍就到这里了,希望这个教程对你理解和使用Python Pandas有所帮助。如果想了解更多关于Pandas的功能和用法,请查阅官方文档。