如何使用 Pandas 将 Excel 文件导入Python ?
并非总是能够以 CSV 格式获取数据集。因此, Pandas为我们提供了将其他格式的数据集转换为 Data frame 的功能。 excel 文件具有“.xlsx”格式。
在开始之前,我们需要安装一些库。
pip install pandas
pip install xlrd
为了使用 Pandas 将 Excel 文件导入Python ,我们必须使用pandas.read_excel()函数。
Syntax: pandas.read_excel(io, sheet_name=0, header=0, names=None,….)
Return: DataFrame or dict of DataFrames.
假设 Excel 文件如下所示:
现在,我们可以深入研究代码。
示例 1:读取 Excel 文件。
Python3
import pandas as pd
df = pd.read_excel("sample.xlsx")
print(df)
Python3
import pandas as pd
# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
index_col = 0)
print(df)
Python3
import pandas as pd
df = pd.read_excel('sample.xlsx',
header = None)
print(df)
Python3
import pandas as pd
df = pd.read_excel('sample.xlsx',
dtype = {"Products": str,
"Price":float})
print(df)
Python3
import pandas as pd
df = pd.read_excel('sample.xlsx',
na_values =['item1',
'item2'])
print(df)
输出:
示例 2:要选择特定列,我们可以传递一个参数“ index_col ”。
Python3
import pandas as pd
# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
index_col = 0)
print(df)
输出:
示例 3:如果您不喜欢列的初始标题,可以使用参数“ header”将其更改为索引。
Python3
import pandas as pd
df = pd.read_excel('sample.xlsx',
header = None)
print(df)
输出:
示例 4:如果要更改特定列的数据类型,可以使用参数“ dtype ”来完成。
Python3
import pandas as pd
df = pd.read_excel('sample.xlsx',
dtype = {"Products": str,
"Price":float})
print(df)
输出:
示例 5:如果您有未知值,则可以使用参数“ na_values ”处理它。它将提到的未知值转换为“ NaN ”
Python3
import pandas as pd
df = pd.read_excel('sample.xlsx',
na_values =['item1',
'item2'])
print(df)
输出: