📅  最后修改于: 2023-12-03 14:57:40.498000             🧑  作者: Mango
在数据分析和数据处理过程中,pandas 是一个非常常用且强大的 Python 库。它提供了高性能、易于使用的数据结构和数据分析工具。本文将重点介绍如何使用 pandas 访问和操作数据框(DataFrame)中的列。
首先,我们需要导入 pandas 库。可以使用以下代码行将其导入并指定别名为 pd
:
import pandas as pd
数据框是 pandas 中最常用的数据结构之一。我们可以从各种数据源(如 CSV 文件、数据库查询结果等)中创建数据框,或者可以手动创建一个数据框。
以下是一个创建数据框的示例,其中包含了两列数据:name
和 age
:
import pandas as pd
data = {'name': ['Alice', 'Bob', 'Charlie', 'David', 'Eve'],
'age': [25, 30, 35, 40, 45]}
df = pd.DataFrame(data)
一旦有了数据框,我们可以使用列名称访问其中的列。有几种常用的方法可以实现这一目的。
使用点操作符可以通过列名直接访问列。以下是示例代码:
df.name
另一种常用的方法是使用方括号操作符,并将列名作为字符串传递给它。以下是示例代码:
df['name']
还可以使用 loc
属性,通过指定行和列的标签来访问列。在这种情况下,我们只需指定列名称。以下是示例代码:
df.loc[:, 'name']
其中 :
表示所有行。
在某些情况下,我们可能更希望通过列索引访问列,而不是使用列名称。此时,可以使用 iloc
属性,并传递列索引作为参数。以下是示例代码:
df.iloc[:, 0]
其中 0
表示第一列。
我们不仅可以访问列数据,还可以修改它们。下面是一些常用的方法:
可以直接通过列名将新值赋给列。以下是示例代码:
df.age = [30, 32, 37, 42, 47]
与访问列一样,我们可以使用 loc
属性来修改特定列的数据。以下是示例代码:
df.loc[:, 'name'] = ['Amy', 'Ben', 'Catherine', 'Daniel', 'Emma']
如果需要添加新列,可以通过为数据框分配一个新的 Series 对象来实现。以下是示例代码:
df['gender'] = ['Female', 'Male', 'Female', 'Male', 'Female']
本文介绍了使用 pandas 访问列以及在数据框中修改列数据的不同方法。通过使用这些方法,程序员可以轻松地操作数据框的列,以进行数据分析和处理。
以上就是关于访问列 pandas - Python 的介绍。
注意:请将本文保存为 Markdown 文件以正确显示代码块的格式。