📅  最后修改于: 2023-12-03 14:49:26.516000             🧑  作者: Mango
在 Python 中,Pandas 是一种流行的数据分析库,它提供了许多用于处理和操作数据的数据结构和函数。在本文中,我们将介绍如何使用 Pandas 从现有数据框中创建新的数据框。
首先,我们需要导入 Pandas 库。在导入 Pandas 库之后,我们可以使用 Pandas 的 DataFrame 类来创建一个数据框。
import pandas as pd
# 创建一个字典,其中包含一些数据
data = {'name': ['张三', '李四', '王五', '赵六'],
'age': [20, 21, 22, 23],
'sex': ['男', '女', '男', '女']}
# 使用 Pandas 的 DataFrame 类来创建一个数据框
df = pd.DataFrame(data)
# 打印数据框
print(df)
输出结果如下:
name age sex
0 张三 20 男
1 李四 21 女
2 王五 22 男
3 赵六 23 女
在上面的代码中,我们首先使用字典来创建一个包含一些数据的数据结构。接下来,我们使用 Pandas 的 DataFrame 类来创建一个数据框。最后,我们使用 print 函数来输出数据框的内容。
现在我们知道如何创建一个数据框,但有时候我们需要从现有的数据框中创建一个新的数据框。这可以通过 Pandas 的 loc 或 iloc 方法实现。
loc 方法用于基于标签从数据框中选择行和列。我们可以使用它来选择需要复制到新数据框中的数据。
# 创建一个新的数据框,它包含原始数据框的前两行和两个特定的列
new_df = df.loc[0:1, ['name', 'age']]
# 打印新的数据框
print(new_df)
输出结果如下:
name age
0 张三 20
1 李四 21
在上面的代码中,我们使用 loc 方法选择了数据框中的前两行和两个特定的列,并将它们复制到一个新的数据框中。
iloc 方法用于基于整数位置从数据框中选择行和列。它与 loc 方法的工作方式类似,但使用的是整数位置而不是标签。
# 创建一个新的数据框,它包含原始数据框的第二和第三行以及所有列
new_df = df.iloc[1:3, :]
# 打印新的数据框
print(new_df)
输出结果如下:
name age sex
1 李四 21 女
2 王五 22 男
在上面的代码中,我们使用 iloc 方法选择了数据框中的第二和第三行以及所有列,并将它们复制到一个新的数据框中。
在本文中,我们介绍了如何使用 Pandas 从现有数据框中创建新的数据框。我们学习了如何使用 loc 和 iloc 方法选择需要放入新数据框中的数据。Pandas 巨大的功能集能够处理各种数据类型和数据结构,使其成为数据科学家和分析师的必备工具之一。