📅  最后修改于: 2023-12-03 15:11:59.589000             🧑  作者: Mango
如果你在处理数据分析项目中使用了 Pandas,那么有时需要计算某一列中的特定实例。本文将介绍如何使用 Pandas 计算由 Python 列表、NumPy 数组、字典和 Pandas Series 组成的列的特定实例。
使用 Pandas 可以方便地计算一列中满足条件的实例。下面的代码演示如何计算年龄列中大于 30 岁的个数:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'age': [25, 35, 22, 45]}
df = pd.DataFrame(data)
# 计算年龄列中大于 30 岁的个数
count = len(df[df['age'] > 30])
print('年龄大于 30 岁的个数:', count)
输出结果为:年龄大于 30 岁的个数: 2
使用 Pandas 可以方便地计算一列中不同值的出现次数。下面的代码示例展示了如何计算 State 列中不同值的出现次数。
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'state': ['NY', 'CA', 'NY', 'NY']}
df = pd.DataFrame(data)
# 计算 State 列中不同值的出现次数
value_counts = df['state'].value_counts()
print('State 列中不同值的出现次数:\n', value_counts)
输出结果为:
State 列中不同值的出现次数:
NY 3
CA 1
Name: state, dtype: int64
使用 Pandas 可以方便地计算一列中某个值出现的次数。下面的代码演示如何计算 State 列中出现 "NY" 的次数:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'state': ['NY', 'CA', 'NY', 'NY']}
df = pd.DataFrame(data)
# 计算 State 列中出现 "NY" 的次数
count = len(df[df['state'] == 'NY'])
print('State 列中出现 "NY" 的次数:', count)
输出结果为:State 列中出现 "NY" 的次数: 3
使用 Pandas 可以方便地计算一列中特定值的和。下面的代码显示了如何计算 salary 列中值为 10000 的总和:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'salary': [10000, 20000, 10000, 30000]}
df = pd.DataFrame(data)
# 计算 salary 列中值为 10000 的总和
sum = df[df['salary'] == 10000]['salary'].sum()
print('salary 列中值为 10000 的总和:', sum)
输出结果为:salary 列中值为 10000 的总和: 20000
使用 Pandas 可以方便地计算一个数据框中特定值的和。下面的代码演示了如何计算 salary 和 bonus 列的总和:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David'], 'salary': [10000, 20000, 10000, 30000], 'bonus': [5000, 4000, 2000, 10000]}
df = pd.DataFrame(data)
# 计算 salary 和 bonus 列的总和
sum = df['salary'].sum() + df['bonus'].sum()
print('salary 和 bonus 列的总和:', sum)
输出结果为:salary 和 bonus 列的总和: 92000
以上就是计算 Pandas 列中的特定实例的方法。除此之外,Pandas 还支持更多的计算方式和函数。可以查阅 Pandas 文档以获取更详细的信息。