📅  最后修改于: 2020-04-19 14:34:10             🧑  作者: Mango
Pandas DataFrame是带有标签轴(行和列)的二维大小可变的,可能是异构的表格数据结构。数据框是二维数据结构,即,数据以表格形式在行和列中对齐。Pandas DataFrame由三个主要组件组成,即data,rows和column。
我们将简要介绍可以在Pandas DataFrame上执行的所有这些基本操作:
在现实世界中,将通过从现有存储中加载数据集来创建Pandas DataFrame,存储可以是SQL数据库,CSV文件和Excel文件。可以从列表,元组和字典列表等中创建Pandas DataFrame。可以以不同的方式创建数据框,以下是我们创建数据框的一些方法:
使用List创建数据框:可以使用单个列表或列表列表创建DataFrame:
import pandas as pd # 字符串列表 lst = ['Geeks', 'For', 'Geeks', 'is', 'portal', 'for', 'Geeks'] # Calling DataFrame constructor on list df = pd.DataFrame(lst) print(df)
输出:
从ndarray / list的dict创建DataFrame:要从narray / list的dict创建DataFrame,所有narray的长度必须相同。如果传递了索引,则索引长度应等于数组的长度。如果没有传递索引,则默认情况下,索引将是range(n),其中n是数组长度。
# Python代码演示从dict narray/列表创建DataFrame
# 默认地址.
import pandas as pd
# 初始化列表数据.
data = {'Name':['Tom', 'nick', 'krish', 'jack'],
'Age':[20, 21, 19, 18]}
# 创建数据框
df = pd.DataFrame(data)
# Print the output.
print(df)