📜  pandas 读取某些列的 excel - Python (1)

📅  最后修改于: 2023-12-03 15:18:15.557000             🧑  作者: Mango

pandas 读取某些列的 Excel - Python

简介

在数据处理和分析中,pandas 是一个非常强大和常用的工具。它提供了丰富的功能,包括读取和写入各种数据格式。本文将介绍如何使用 pandas 读取 Excel 文件的某些列数据,以及如何对这些数据进行操作和处理。

安装 pandas

在开始之前,首先需要安装 pandas 库。可以通过以下命令使用 pip 安装:

pip install pandas
读取 Excel 文件

要读取 Excel 文件,我们可以使用 pandasread_excel() 函数。下面是一个简单的示例,展示了如何读取 Excel 文件中的所有数据:

import pandas as pd

data = pd.read_excel('data.xlsx')
print(data)

在上面的示例中,我们使用 pd.read_excel() 函数读取了名为 data.xlsx 的 Excel 文件,并将其存储在名为 data 的变量中。接着,使用 print() 函数打印了所有数据。

读取指定列

如果我们只需要读取 Excel 文件中的某些列,可以使用 usecols 参数指定需要读取的列。下面的示例演示了如何读取 Excel 文件中的 列1列3

import pandas as pd

data = pd.read_excel('data.xlsx', usecols=['列1', '列3'])
print(data)

在上面的示例中,我们使用了 usecols 参数,并传入一个包含需要读取的列名的列表。

数据处理和操作

一旦我们成功读取了指定的列数据,我们可以对其进行各种处理和操作。以下是一些常见的操作:

数据筛选

要根据某些条件筛选数据,可以使用 pandas 的条件表达式。例如,以下示例只保留 '列1' 中大于 100 的行:

import pandas as pd

data = pd.read_excel('data.xlsx', usecols=['列1', '列3'])
filtered_data = data[data['列1'] > 100]
print(filtered_data)

在上面的示例中,我们使用了条件表达式 data['列1'] > 100 进行数据筛选。

数据转换

pandas 使得对数据进行各种转换变得轻松。你可以使用 map()apply() 或其他转换函数来修改数据。以下是一些示例:

import pandas as pd

data = pd.read_excel('data.xlsx', usecols=['列1', '列3'])

# 使用 map() 函数将列1的值乘以2
data['列1'] = data['列1'].map(lambda x: x * 2)

# 使用 apply() 函数在列3上计算平方根
data['列3'] = data['列3'].apply(lambda x: x ** 0.5)

print(data)

在上面的示例中,我们使用了 map() 函数将 '列1' 的值乘以 2,并使用 apply() 函数计算 '列3' 的平方根。

数据汇总

pandas 具有灵活的数据汇总功能,可以使用 groupby() 函数对数据进行分组和聚合。以下示例展示了如何对 '列1' 进行分组,并计算平均值和总和:

import pandas as pd

data = pd.read_excel('data.xlsx', usecols=['列1', '列3'])

grouped_data = data.groupby('列1').agg({'列3': ['mean', 'sum']})
print(grouped_data)

在上面的示例中,我们使用了 groupby() 函数将数据按 '列1' 进行分组,并使用 agg() 函数计算了 '列3' 的平均值和总和。

结论

pandas 是一个强大且易于使用的库,用于读取和处理各种数据格式,包括 Excel 文件。通过使用 pandasread_excel() 函数和其他功能,我们可以轻松地读取指定列的 Excel 数据,并对其进行各种操作和处理。

以上就是关于如何使用 pandas 读取某些列的 Excel 数据的介绍。希望本文能够对你有所帮助!