📅  最后修改于: 2023-12-03 15:40:49.123000             🧑  作者: Mango
熊猫(Pandas)是一种用于数据分析的Python库。它提供了快速,灵活和富有表现力的数据结构,旨在使工作人员能够轻松处理与关系或标记数据相关的所有形式的数据。数据帧(DataFrame)是熊猫(Pandas)库的主要数据结构。
数据框(DataFrame)是一种二维标签数据结构,其中每列可以是不同的值类型(例如数字、字符串、布尔值等)。数据框(DataFrame)通常来自一些文件,例如.csv、.txt、.xlsx等。
在Python中使用熊猫(Pandas)库的一个主要任务是将数据结构转换为数据帧(DataFrame)。使用字典(Dictionary)创建数据帧(DataFrame)。
import pandas as pd
data = {'语文': [89, 90, 78, 86],
'数学': [67, 78, 90, 83],
'英语': [78, 94, 67, 76]}
df = pd.DataFrame(data)
print(df)
输出:
语文 数学 英语
0 89 67 78
1 90 78 94
2 78 90 67
3 86 83 76
可以使用许多方法来选择和访问数据框(DataFrame)中的行和列。一些常见的方法如下:
df.head(n)
:选择前n行df.tail(n)
:选择最后n行df[col]
:选择列df.loc[row_index]
:选择行# 选择语文列
print(df['语文'])
# 选择前两行
print(df.head(2))
输出:
0 89
1 90
2 78
3 86
Name: 语文, dtype: int64
语文 数学 英语
0 89 67 78
1 90 78 94
可以使用许多方法来添加和删除数据框(DataFrame)中的行和列。一些常见的方法如下:
df['新列名'] = [列数据]
del df['列名']
df.loc[len(df)] = [数据]
df.drop(df.index[行索引], inplace=True)
# 添加新列
df['物理'] = [76, 87, 65, 90]
print(df)
# 删除"英语"列
del df['英语']
print(df)
# 添加一行
df.loc[len(df)] = [65, 75, 92, 87]
print(df)
# 删除第二行
df.drop(df.index[1], inplace=True)
print(df)
输出:
语文 数学 英语 物理
0 89 67 78 76
1 90 78 94 87
2 78 90 67 65
3 86 83 76 90
语文 数学 物理
0 89 67 76
1 90 78 87
2 78 90 65
3 86 83 90
语文 数学 物理 0
0 89 67 76 0
1 90 78 87 1
2 78 90 65 2
3 86 83 90 3
语文 数学 物理 0
0 89 67 76 0
2 78 90 65 2
3 86 83 90 3
在本文中,我们已经介绍了如何使用熊猫(Pandas)库创建、选择、访问、添加和删除数据框(DataFrame)中的行和列。这些操作是数据分析中的基本操作,以及使用熊猫(Pandas)库进行数据分析的第一步。