📅  最后修改于: 2023-12-03 15:39:37.806000             🧑  作者: Mango
“熊猫(Pandas)”是一个基于NumPy的Python数据分析库,它是由Wes McKinney于2008年开始开发的,最初被称为“一个强大的数据结构解决方案”,它提供了大量的数据操作工具。
熊猫主要有两个数据结构: Series和DataFrame 。Series对象是一维数组,每个元素都具有相同的数据类型。而DataFrame对象是二维表格,由行和列组成,可以看做Series对象的集合。
除此之外,熊猫还拥有与SQL和Excel等数据库和电子表格软件相似的功能,因此常常被用于数据清洗、数据预处理、数据分析和机器学习等领域。
使用pip直接安装:
pip install pandas
我们通过一个简单的例子来介绍如何使用熊猫:
import pandas as pd
# 创建一个Series对象
data = pd.Series([0.25, 0.5, 0.75, 1.0])
print(data)
# 创建一个DataFrame对象
data = pd.DataFrame({
'name': ['Mike', 'Lucy', 'Tom', 'Jerry'],
'age': [20, 23, 25, 27],
'gender': ['M', 'F', 'M', 'M']
})
print(data)
上述代码输出:
0 0.25
1 0.50
2 0.75
3 1.00
dtype: float64
name age gender
0 Mike 20 M
1 Lucy 23 F
2 Tom 25 M
3 Jerry 27 M
更多详细内容请查看熊猫的官方文档。
熊猫是一个基于NumPy的Python数据分析库,主要提供了Series和DataFrame两种数据结构。熊猫的强大之处在于,它不仅提供了丰富的数据操作工具,还拥有与SQL和Excel等数据库和电子表格软件相似的功能,因此常常被用于数据清洗、数据预处理、数据分析和机器学习等领域。