📅  最后修改于: 2023-12-03 14:56:12.316000             🧑  作者: Mango
Pandas 是 Python 中用于数据分析的库。它提供了高性能、易于使用的数据结构和数据分析工具。其中,熊猫系列是 Pandas 中的重要一部分,主要包括Series 和 DataFrame 两种数据结构。
Series 是一种类似于一维数组的对象,其中的每个元素都有一个标签,被称为索引。Series 可以存储任何数据类型。
可以通过列表或 NumPy 数组创建 Series:
import pandas as pd
# 列表创建 Series
data = [1, 2, 3, 4]
s = pd.Series(data)
print(s)
# NumPy 数组创建 Series
import numpy as np
data = np.array([1, 2, 3, 4])
s = pd.Series(data)
print(s)
Series 具有许多属性和方法,以下是一些常用的:
# Series 的值
print(s.values)
# Series 的索引
print(s.index)
# Series 的名称
s.name = 'myseries'
print(s)
# Series 的描述统计信息
print(s.describe())
# Series 的排序
print(s.sort_values())
DataFrame 是一种类似于二维数组的对象,其中每列可以是不同的数据类型,是一个表格型的数据结构,常用于处理实验室和业务数据。
可以通过字典、列表、Series 和 NumPy 数组等创建 DataFrame:
# 字典创建 DataFrame
data = {'name': ['Alice', 'Bob', 'Charlie'], 'score': [80, 90, 70]}
df = pd.DataFrame(data)
print(df)
# 列表创建 DataFrame
data = [['Alice', 80], ['Bob', 90], ['Charlie', 70]]
df = pd.DataFrame(data, columns=['name', 'score'])
print(df)
# Series 创建 DataFrame
s1 = pd.Series(['Alice', 'Bob', 'Charlie'])
s2 = pd.Series([80, 90, 70])
df = pd.DataFrame({'name': s1, 'score': s2})
print(df)
# NumPy 数组创建 DataFrame
data = np.array([['Alice', 80], ['Bob', 90], ['Charlie', 70]])
df = pd.DataFrame(data, columns=['name', 'score'])
print(df)
DataFrame 也有许多属性和方法,以下是一些常用的:
# DataFrame 的值
print(df.values)
# DataFrame 的列名
print(df.columns)
# DataFrame 的索引
print(df.index)
# DataFrame 的形状
print(df.shape)
# DataFrame 的描述统计信息
print(df.describe())
# DataFrame 的排序
print(df.sort_values(by='score'))
# DataFrame 的选择
print(df['name'])
print(df.loc[0])
熊猫系列的长度指的是 Series 或 DataFrame 中的元素个数。通过本文,我们学习了熊猫系列的创建、属性和方法,掌握了如何使用 Pandas 进行数据分析。希望本文对你有所帮助!