📌  相关文章
📜  python - 提取每个列名的最小值和最大值 - Python (1)

📅  最后修改于: 2023-12-03 14:45:54.460000             🧑  作者: Mango

提取每个列名的最小值和最大值 - Python

在数据分析和处理中,经常需要对数据集的每个列名(或特征)计算最小值和最大值。Python 提供了多种方法来实现这一功能,包括使用 pandas 库、numpy 库和纯 Python 编写的方法。

下面将介绍三种常用的方法,并提供相应的代码片段。

方法1:使用 pandas 库
import pandas as pd

data = pd.DataFrame({'col1': [1, 2, 3, 4, 5],
                     'col2': [6, 7, 8, 9, 10],
                     'col3': [11, 12, 13, 14, 15]})

min_values = data.min()
max_values = data.max()

print("最小值:")
print(min_values)

print("\n最大值:")
print(max_values)

此方法使用 pandas 的 DataFrame 对象,通过调用 min()max() 方法即可得到每个列名的最小值和最大值。输出结果将以 pandas 的数据结构进行展示。

方法2:使用 numpy 库
import numpy as np

data = np.array([[1, 2, 3, 4, 5],
                 [6, 7, 8, 9, 10],
                 [11, 12, 13, 14, 15]])

min_values = np.min(data, axis=1)
max_values = np.max(data, axis=1)

print("最小值:")
print(min_values)

print("\n最大值:")
print(max_values)

此方法使用 numpy 的 ndarray 对象,通过调用 np.min()np.max() 方法,并指定 axis=1 参数来计算每行的最小值和最大值。输出结果将以 numpy 数组的形式呈现。

方法3:使用纯 Python 编写的方法
data = {'col1': [1, 2, 3, 4, 5],
        'col2': [6, 7, 8, 9, 10],
        'col3': [11, 12, 13, 14, 15]}

min_values = []
max_values = []

for col in data.keys():
    min_val = min(data[col])
    max_val = max(data[col])
    min_values.append(min_val)
    max_values.append(max_val)

print("最小值:")
print(min_values)

print("\n最大值:")
print(max_values)

此方法需要将数据保存为字典形式,然后使用循环遍历每个列名,分别计算最小值和最大值。结果存储在两个列表中。

以上三种方法都可以实现提取每个列名的最小值和最大值的功能,根据实际需求选择适合的方法即可。