📅  最后修改于: 2020-04-19 14:37:21             🧑  作者: Mango
在现实世界中,将通过从现有存储中加载数据集来创建Pandas DataFrame,存储可以是SQL数据库,CSV文件和Excel文件。可以从列表,字典以及字典列表等创建Pandas DataFrame。
数据框是二维数据结构,即,数据以表格形式在行和列中对齐。在以行和列排列的数据框数据集中,我们可以在一个数据框中存储任意数量的数据集。我们可以对这些数据集执行许多操作,例如算术运算,列/行选择,列/行加法等。
Pandas DataFrame可以通过多种方式创建。让我们一一讨论创建DataFrame的不同方法。
创建一个空的数据
框:一个可以创建的基本数据框是一个空的数据框。仅通过调用数据框构造函数即可创建一个空数据框。
# 将pandas作为pd导入
import pandas as pd
# 调用DataFrame构造函数
df = pd.DataFrame()
print(df)
输出:
Empty DataFrame
Columns: []
Index: []
使用List创建DataFrame:可以使用单个列表或列表列表创建DataFrame:
# 将pandas作为pd导入
import pandas as pd
# list of strings
lst = ['Geeks', 'For', 'Geeks', 'is',
'portal', 'for', 'Geeks']
# 在列表上调用DataFrame构造函数
df = pd.DataFrame(lst)
print(df)
输出:
从ndarray / list的dict创建DataFrame:
要从narray / list的dict创建DataFrame,所有narray的长度必须相同。如果传递了索引,则索长度应等于数组的长度。如果没有传递索引,则默认情况下,索引将是range(n),其中n是数组长度。
# Python代码演示从dict narray /列表创建DataFrame
# 默认地址.
import pandas as pd
# 初始化列表数据。
data = {'Name':['Tom', 'nick', 'krish', 'jack'], 'Age':[20, 21, 19, 18]}
# Create DataFrame
df = pd.DataFrame(data)
# Print the output.
print(df)
输出:
使用字典:
创建pandas数据框:可以通过不同的方式使用字典从列表中创建pandas数据框。我们可以使用字典从列表创建pandas数据框pandas.DataFrame
。使用Pandas中的此方法,我们可以将列表的字典转换为数据框。
# 将pandas作为pd导入
import pandas as pd
# 列表字典
dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"],
'degree': ["MBA", "BCA", "M.Tech", "MBA"],
'score':[90, 40, 80, 98]}
df = pd.DataFrame(dict)
print(df)
输出: