📅  最后修改于: 2023-12-03 15:27:05.207000             🧑  作者: Mango
熊猫(pandas)是 Python 编程语言中广泛使用的开源数据分析和操作工具,它可以高效地处理大量数据,包括数据的分组、拆分、透视、合并等各种常见数据操作。
在 pandas 中,数据最基本的存储结构是数据框(DataFrame),可以将其理解为一个表格,其中每一列代表一个变量,每一行代表一个观测。
下面是一个简单的例子,演示如何使用 pandas 创建新的数据框:
import pandas as pd
# 声明数据
data = {'姓名': ['小明', '小红', '小张', '小王'],
'性别': ['男', '女', '男', '男'],
'年龄': [20, 22, 21, 24],
'身高(cm)': [180, 170, 175, 185]}
# 创建数据框
df = pd.DataFrame(data)
# 显示数据框
print(df)
运行结果如下:
姓名 性别 年龄 身高(cm)
0 小明 男 20 180
1 小红 女 22 170
2 小张 男 21 175
3 小王 男 24 185
代码解析:
当然,这只是一个简单的例子,pandas 还包含了许多其他高级的数据操作和分析方法,可以提高数据处理的效率和精度。
创建数据框的方式很多,你也可以使用 pandas 读取外部的数据文件,例如 Excel、CSV、SQL 等格式,来生成数据框对象。总之,熟练掌握 pandas 库的使用,可以让数据处理工作变得更加简单、高效。