📜  熊猫系列与数据框 - Python (1)

📅  最后修改于: 2023-12-03 15:40:49.123000             🧑  作者: Mango

熊猫系列与数据框 - Python

熊猫(Pandas)是一种用于数据分析的Python库。它提供了快速,灵活和富有表现力的数据结构,旨在使工作人员能够轻松处理与关系或标记数据相关的所有形式的数据。数据帧(DataFrame)是熊猫(Pandas)库的主要数据结构。

数据框

数据框(DataFrame)是一种二维标签数据结构,其中每列可以是不同的值类型(例如数字、字符串、布尔值等)。数据框(DataFrame)通常来自一些文件,例如.csv、.txt、.xlsx等。

创建数据框

在Python中使用熊猫(Pandas)库的一个主要任务是将数据结构转换为数据帧(DataFrame)。使用字典(Dictionary)创建数据帧(DataFrame)。

import pandas as pd

data = {'语文': [89, 90, 78, 86],
        '数学': [67, 78, 90, 83],
        '英语': [78, 94, 67, 76]}

df = pd.DataFrame(data)
print(df)

输出:

   语文  数学  英语
0  89  67  78
1  90  78  94
2  78  90  67
3  86  83  76
选择和访问行和列

可以使用许多方法来选择和访问数据框(DataFrame)中的行和列。一些常见的方法如下:

  • df.head(n):选择前n行
  • df.tail(n):选择最后n行
  • df[col]:选择列
  • df.loc[row_index]:选择行
# 选择语文列
print(df['语文'])

# 选择前两行
print(df.head(2))

输出:

0    89
1    90
2    78
3    86
Name: 语文, dtype: int64
   语文  数学  英语
0  89  67  78
1  90  78  94
添加和删除行和列

可以使用许多方法来添加和删除数据框(DataFrame)中的行和列。一些常见的方法如下:

  • 添加列:df['新列名'] = [列数据]
  • 删除列:del df['列名']
  • 添加行:df.loc[len(df)] = [数据]
  • 删除行:df.drop(df.index[行索引], inplace=True)
# 添加新列
df['物理'] = [76, 87, 65, 90]
print(df)

# 删除"英语"列
del df['英语']
print(df)

# 添加一行
df.loc[len(df)] = [65, 75, 92, 87]
print(df)

# 删除第二行
df.drop(df.index[1], inplace=True)
print(df)

输出:

   语文  数学  英语  物理
0  89  67  78  76
1  90  78  94  87
2  78  90  67  65
3  86  83  76  90
   语文  数学  物理
0  89  67  76
1  90  78  87
2  78  90  65
3  86  83  90
   语文  数学  物理  0
0  89  67  76  0
1  90  78  87  1
2  78  90  65  2
3  86  83  90  3
   语文  数学  物理  0
0  89  67  76  0
2  78  90  65  2
3  86  83  90  3
总结

在本文中,我们已经介绍了如何使用熊猫(Pandas)库创建、选择、访问、添加和删除数据框(DataFrame)中的行和列。这些操作是数据分析中的基本操作,以及使用熊猫(Pandas)库进行数据分析的第一步。