📅  最后修改于: 2023-12-03 14:45:54.460000             🧑  作者: Mango
在数据分析和处理中,经常需要对数据集的每个列名(或特征)计算最小值和最大值。Python 提供了多种方法来实现这一功能,包括使用 pandas 库、numpy 库和纯 Python 编写的方法。
下面将介绍三种常用的方法,并提供相应的代码片段。
import pandas as pd
data = pd.DataFrame({'col1': [1, 2, 3, 4, 5],
'col2': [6, 7, 8, 9, 10],
'col3': [11, 12, 13, 14, 15]})
min_values = data.min()
max_values = data.max()
print("最小值:")
print(min_values)
print("\n最大值:")
print(max_values)
此方法使用 pandas 的 DataFrame
对象,通过调用 min()
和 max()
方法即可得到每个列名的最小值和最大值。输出结果将以 pandas 的数据结构进行展示。
import numpy as np
data = np.array([[1, 2, 3, 4, 5],
[6, 7, 8, 9, 10],
[11, 12, 13, 14, 15]])
min_values = np.min(data, axis=1)
max_values = np.max(data, axis=1)
print("最小值:")
print(min_values)
print("\n最大值:")
print(max_values)
此方法使用 numpy 的 ndarray
对象,通过调用 np.min()
和 np.max()
方法,并指定 axis=1
参数来计算每行的最小值和最大值。输出结果将以 numpy 数组的形式呈现。
data = {'col1': [1, 2, 3, 4, 5],
'col2': [6, 7, 8, 9, 10],
'col3': [11, 12, 13, 14, 15]}
min_values = []
max_values = []
for col in data.keys():
min_val = min(data[col])
max_val = max(data[col])
min_values.append(min_val)
max_values.append(max_val)
print("最小值:")
print(min_values)
print("\n最大值:")
print(max_values)
此方法需要将数据保存为字典形式,然后使用循环遍历每个列名,分别计算最小值和最大值。结果存储在两个列表中。
以上三种方法都可以实现提取每个列名的最小值和最大值的功能,根据实际需求选择适合的方法即可。