📅  最后修改于: 2023-12-03 15:07:46.520000             🧑  作者: Mango
在数据处理过程中,有时候需要删除多个列。Python 提供了一些方法来实现这个目的。
Pandas 是 Python 的一个数据处理库,可以在不影响原始数据的情况下修改数据。以下是使用 Pandas 删除多个列的方法:
import pandas as pd
# 创建数据表
data = {'name': ['john', 'lucy', 'tom'],
'age': [25, 27, 28],
'gender': ['M', 'F', 'M'],
'height': [175, 160, 180],
'weight': [65, 55, 75]}
df = pd.DataFrame(data)
# 删除多个列
df = df.drop(['age', 'weight'], axis=1)
其中,drop 函数是 Pandas 提供的删除函数,可以通过指定列名和轴向来删除列。axis=1
表示删除列。以上代码会删除 age
和 weight
两列,得到如下数据表:
| name | gender | height | | ---- | ------ | ------ | | john | M | 175 | | lucy | F | 160 | | tom | M | 180 |
NumPy 是 Python 的一个科学计算库,同样可以用于数据处理。以下是使用 NumPy 删除多个列的方法:
import numpy as np
# 创建数据表
data = np.array([[25, 175, 65],
[27, 160, 55],
[28, 180, 75]])
# 删除多个列
data = np.delete(data, [0, 2], axis=1)
其中,delete 函数是 NumPy 提供的删除函数,可以通过指定数组和轴向来删除元素。axis=1
表示删除列。以上代码会删除第 1 列和第 3 列,得到如下数据表:
| | | | - | - | | 175 | | | 160 | | | 180 | |
以上是 Python 在数据处理中删除多个列的两种方法。Pandas 提供了比 NumPy 更多更灵活的功能,是处理数据的首选。但是如果只需要简单的删除操作,NumPy 也是一个不错的选择。