📜  计算 Pandas Dataframe 中的值(1)

📅  最后修改于: 2023-12-03 15:41:36.735000             🧑  作者: Mango

计算 Pandas Dataframe 中的值

Pandas 是 Python 中一个强大的数据处理库。在 Pandas 中,DataFrame 是一种二维表格,它可以方便地存储和处理数据。在本文中,我们将介绍如何计算 Pandas DataFrame 中的值。

计算 DataFrame 中的值

Pandas DataFrame 中的值可以通过各种方式进行计算,例如基本算术运算、聚合函数、逻辑运算等。

基本算术运算

DataFrame 中的基本算术运算包括加法、减法、乘法和除法。

import pandas as pd

# 创建 DataFrame
data = {'name': ['John', 'Alice', 'Bob', 'Jack'],
        'age': [28, 24, 22, 30],
        'salary': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)

# 加法运算
df['bonus'] = df['salary'] + 1000

# 减法运算
df['tax'] = df['salary'] - df['salary'] * 0.1

# 乘法运算
df['income'] = df['salary'] * 12

# 除法运算
df['hourly_salary'] = df['salary'] / 200

print(df)

输出结果为:

    name  age  salary  bonus    tax  income  hourly_salary
0   John   28    5000   6000  4500.0   60000          25.00
1  Alice   24    6000   7000  5400.0   72000          30.00
2    Bob   22    4000   5000  3600.0   48000          20.00
3   Jack   30    7000   8000  6300.0   84000          35.00
聚合函数

Pandas DataFrame 中的聚合函数包括 sum、mean、median、min 和 max。

import pandas as pd

# 创建 DataFrame
data = {'name': ['John', 'Alice', 'Bob', 'Jack'],
        'age': [28, 24, 22, 30],
        'salary': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)

# 计算总薪资
total_salary = df['salary'].sum()
print('Total Salary:', total_salary)

# 计算平均年龄
mean_age = df['age'].mean()
print('Mean Age:', mean_age)

# 计算薪资中位数
median_salary = df['salary'].median()
print('Median Salary:', median_salary)

# 计算最小薪资
min_salary = df['salary'].min()
print('Min Salary:', min_salary)

# 计算最大薪资
max_salary = df['salary'].max()
print('Max Salary:', max_salary)

输出结果为:

Total Salary: 22000
Mean Age: 26.0
Median Salary: 5500.0
Min Salary: 4000
Max Salary: 7000
逻辑运算

Pandas DataFrame 中的逻辑运算包括与、或和非三种运算。

import pandas as pd

# 创建 DataFrame
data = {'name': ['John', 'Alice', 'Bob', 'Jack'],
        'age': [28, 24, 22, 30],
        'salary': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)

# 与运算
df1 = df[(df['age'] > 25) & (df['salary'] > 5000)]
print(df1)

# 或运算
df2 = df[(df['age'] > 25) | (df['salary'] > 5000)]
print(df2)

# 非运算
df3 = df[~(df['age'] > 25)]
print(df3)

输出结果分别为:

   name  age  salary
0  John   28    5000
3  Jack   30    7000

    name  age  salary
0   John   28    5000
1  Alice   24    6000
3   Jack   30    7000

    name  age  salary
1  Alice   24    6000
2    Bob   22    4000
总结

在本文中,我们介绍了如何计算 Pandas DataFrame 中的值,包括基本算术运算、聚合函数和逻辑运算。这些计算可以帮助我们更好地处理和分析数据。