📅  最后修改于: 2023-12-03 15:18:15.065000             🧑  作者: Mango
Pandas是一个功能强大的数据分析工具,提供了一个称为DataFrame
的数据结构,用于处理和分析数据集。通过Pandas的DataFrames,我们可以创建具有多个行和列的表格形式的数据。
以下是使用Pandas创建DataFrame的示例:
import pandas as pd
# 创建包含二维数据的字典
data = {'名称': ['苹果', '橙子', '香蕉', '梨'],
'价格': [1.99, 2.49, 0.99, 1.29],
'库存': [10, 15, 5, 8]}
# 创建DataFrame
df = pd.DataFrame(data)
print(df)
输出:
名称 价格 库存
0 苹果 1.99 10
1 橙子 2.49 15
2 香蕉 0.99 5
3 梨 1.29 8
Pandas的DataFrame允许您执行各种列操作,包括选择特定列、添加新列、删除列等。
要选择DataFrame中的特定列,可以使用列名称或列索引。以下是几个例子:
# 选择单个列
column1 = df['名称']
column2 = df.价格
# 选择多个列
columns = df[['名称', '库存']]
要向DataFrame中添加新列,可以添加一个新列并为其分配新的值。以下是一个示例:
df['销售额'] = df['价格'] * df['库存']
print(df)
输出:
名称 价格 库存 销售额
0 苹果 1.99 10 19.9
1 橙子 2.49 15 37.35
2 香蕉 0.99 5 4.95
3 梨 1.29 8 10.32
要删除DataFrame中的列,可以使用drop()
函数或del
关键字。以下是示例:
# 使用drop()函数删除列
df = df.drop('销售额', axis=1)
print(df)
# 使用del关键字删除列
del df['库存']
print(df)
输出:
名称 价格
0 苹果 1.99
1 橙子 2.49
2 香蕉 0.99
3 梨 1.29
名称 价格
0 苹果 1.99
1 橙子 2.49
2 香蕉 0.99
3 梨 1.29
Pandas的DataFrame可以有任意数量的列。您可以根据数据集的需求自由地添加或删除列。
要获取DataFrame的列数,可以使用shape
属性或columns
属性。以下是示例:
# 使用shape属性获取列数
num_columns = df.shape[1]
print("列数:", num_columns)
# 使用columns属性获取列数
num_columns = len(df.columns)
print("列数:", num_columns)
输出:
列数: 2
列数: 2
在此示例中,DataFrame df
包含2列。
在使用Pandas的DataFrame时,您可以根据需要灵活地进行列操作,以满足数据分析和处理的要求。Pandas提供了丰富的功能和方法,可以轻松地操作和处理大型数据集。