📜  pandas 对列执行操作 - Python (1)

📅  最后修改于: 2023-12-03 14:45:03.754000             🧑  作者: Mango

Pandas 对列执行操作 - Python

Pandas 是 Python 中最常用的数据处理库之一,它提供了很多方便的函数和方法来操作数据。在本文中,我们将介绍如何使用 Pandas 对列执行操作。

创建数据

首先,让我们创建一个简单的数据集来演示如何操作 Pandas 列:

import pandas as pd

data = {'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Eva'],
        'Age': [25, 30, 35, 40, 45],
        'Salary': [50000, 60000, 70000, 80000, 90000]}

df = pd.DataFrame(data)

print(df)

输出结果:

       Name  Age  Salary
0     Alice   25   50000
1       Bob   30   60000
2   Charlie   35   70000
3     David   40   80000
4       Eva   45   90000

我们可以看到,上面的代码使用 Pandas 创建了一个包含 Name、Age 和 Salary 三列数据的 DataFrame,其中 Name 列包含字符串值,Age 和 Salary 列包含整数。

选择列

要选择 Pandas DataFrame 中的列,请使用列名或列号。例如,要选择 Name 列:

names = df['Name']
print(names)

输出结果:

0      Alice
1        Bob
2    Charlie
3      David
4        Eva
Name: Name, dtype: object

要选择多列,请传递列名列表:

cols = ['Age', 'Salary']
data = df[cols]
print(data)

输出结果:

   Age  Salary
0   25   50000
1   30   60000
2   35   70000
3   40   80000
4   45   90000
添加列

要添加列到 Pandas DataFrame,请使用列名并指定所需值。例如,要添加一列 Hobby:

hobbies = ['Fishing', 'Painting', 'Reading', 'Hiking', 'Travelling']
df['Hobby'] = hobbies

print(df)

输出结果:

       Name  Age  Salary       Hobby
0     Alice   25   50000     Fishing
1       Bob   30   60000    Painting
2   Charlie   35   70000     Reading
3     David   40   80000      Hiking
4       Eva   45   90000  Travelling

我们可以看到,Pandas DataFrame 中添加了一列 Hobby。

删除列

要删除 Pandas DataFrame 中的列,请使用 drop() 方法。例如,要删除 Hobby 列:

df = df.drop('Hobby', axis=1)

print(df)

输出结果:

       Name  Age  Salary
0     Alice   25   50000
1       Bob   30   60000
2   Charlie   35   70000
3     David   40   80000
4       Eva   45   90000

我们可以看到,Pandas DataFrame 中的 Hobby 列已被删除。

更新列

要更新 Pandas DataFrame 中的列,请使用列名并指定所需值。例如,要更新 Salary 列:

df['Salary'] = df['Salary'] + 10000

print(df)

输出结果:

       Name  Age  Salary
0     Alice   25   60000
1       Bob   30   70000
2   Charlie   35   80000
3     David   40   90000
4       Eva   45  100000

我们可以看到,Pandas DataFrame 中的 Salary 列已被更新。

应用函数到列

要应用函数到 Pandas DataFrame 的列,请使用 apply() 方法,并传递所需的函数。例如,要将 Age 列的所有值加倍:

df['Age'] = df['Age'].apply(lambda x: x * 2)

print(df)

输出结果:

       Name  Age  Salary
0     Alice   50   60000
1       Bob   60   70000
2   Charlie   70   80000
3     David   80   90000
4       Eva   90  100000

我们可以看到,Pandas DataFrame 中的 Age 列已被加倍。

结论

在本文中,我们介绍了如何使用 Pandas 对列执行操作。我们涵盖了如何选择、添加、删除和更新列,以及如何应用函数到列。Pandas 提供了很多方便的函数和方法,使数据处理变得更加简单和快速。