📅  最后修改于: 2023-12-03 15:41:36.735000             🧑  作者: Mango
Pandas 是 Python 中一个强大的数据处理库。在 Pandas 中,DataFrame 是一种二维表格,它可以方便地存储和处理数据。在本文中,我们将介绍如何计算 Pandas DataFrame 中的值。
Pandas DataFrame 中的值可以通过各种方式进行计算,例如基本算术运算、聚合函数、逻辑运算等。
DataFrame 中的基本算术运算包括加法、减法、乘法和除法。
import pandas as pd
# 创建 DataFrame
data = {'name': ['John', 'Alice', 'Bob', 'Jack'],
'age': [28, 24, 22, 30],
'salary': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)
# 加法运算
df['bonus'] = df['salary'] + 1000
# 减法运算
df['tax'] = df['salary'] - df['salary'] * 0.1
# 乘法运算
df['income'] = df['salary'] * 12
# 除法运算
df['hourly_salary'] = df['salary'] / 200
print(df)
输出结果为:
name age salary bonus tax income hourly_salary
0 John 28 5000 6000 4500.0 60000 25.00
1 Alice 24 6000 7000 5400.0 72000 30.00
2 Bob 22 4000 5000 3600.0 48000 20.00
3 Jack 30 7000 8000 6300.0 84000 35.00
Pandas DataFrame 中的聚合函数包括 sum、mean、median、min 和 max。
import pandas as pd
# 创建 DataFrame
data = {'name': ['John', 'Alice', 'Bob', 'Jack'],
'age': [28, 24, 22, 30],
'salary': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)
# 计算总薪资
total_salary = df['salary'].sum()
print('Total Salary:', total_salary)
# 计算平均年龄
mean_age = df['age'].mean()
print('Mean Age:', mean_age)
# 计算薪资中位数
median_salary = df['salary'].median()
print('Median Salary:', median_salary)
# 计算最小薪资
min_salary = df['salary'].min()
print('Min Salary:', min_salary)
# 计算最大薪资
max_salary = df['salary'].max()
print('Max Salary:', max_salary)
输出结果为:
Total Salary: 22000
Mean Age: 26.0
Median Salary: 5500.0
Min Salary: 4000
Max Salary: 7000
Pandas DataFrame 中的逻辑运算包括与、或和非三种运算。
import pandas as pd
# 创建 DataFrame
data = {'name': ['John', 'Alice', 'Bob', 'Jack'],
'age': [28, 24, 22, 30],
'salary': [5000, 6000, 4000, 7000]}
df = pd.DataFrame(data)
# 与运算
df1 = df[(df['age'] > 25) & (df['salary'] > 5000)]
print(df1)
# 或运算
df2 = df[(df['age'] > 25) | (df['salary'] > 5000)]
print(df2)
# 非运算
df3 = df[~(df['age'] > 25)]
print(df3)
输出结果分别为:
name age salary
0 John 28 5000
3 Jack 30 7000
name age salary
0 John 28 5000
1 Alice 24 6000
3 Jack 30 7000
name age salary
1 Alice 24 6000
2 Bob 22 4000
在本文中,我们介绍了如何计算 Pandas DataFrame 中的值,包括基本算术运算、聚合函数和逻辑运算。这些计算可以帮助我们更好地处理和分析数据。