📜  如何使用 Pandas 将 Excel 文件导入Python ?

📅  最后修改于: 2022-05-13 01:55:39.873000             🧑  作者: Mango

如何使用 Pandas 将 Excel 文件导入Python ?

并非总是能够以 CSV 格式获取数据集。因此, Pandas为我们提供了将其他格式的数据集转换为 Data frame 的功能。 excel 文件具有“.xlsx”格式。

在开始之前,我们需要安装一些库。

pip install pandas
pip install xlrd

为了使用 Pandas 将 Excel 文件导入Python ,我们必须使用pandas.read_excel()函数。

假设 Excel 文件如下所示:

Excel文件

现在,我们可以深入研究代码。

示例 1:读取 Excel 文件。

Python3
import pandas as pd
  
df = pd.read_excel("sample.xlsx")
print(df)


Python3
import pandas as pd
  
# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
                   index_col = 0)  
  
print(df)


Python3
import pandas as pd
  
df = pd.read_excel('sample.xlsx',
                   header = None)
print(df)


Python3
import pandas as pd
  
df = pd.read_excel('sample.xlsx', 
                   dtype = {"Products": str,
                            "Price":float})
print(df)


Python3
import pandas as pd
df = pd.read_excel('sample.xlsx', 
                   na_values =['item1', 
                               'item2'])
print(df)


输出:

数据框

示例 2:要选择特定列,我们可以传递一个参数“ index_col ”。

Python3

import pandas as pd
  
# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
                   index_col = 0)  
  
print(df)

输出:

选择特定列

示例 3:如果您不喜欢列的初始标题,可以使用参数“ header”将其更改为索引。

Python3

import pandas as pd
  
df = pd.read_excel('sample.xlsx',
                   header = None)
print(df)

输出:

没有标头的数据框

示例 4:如果要更改特定列的数据类型,可以使用参数“ dtype ”来完成。

Python3

import pandas as pd
  
df = pd.read_excel('sample.xlsx', 
                   dtype = {"Products": str,
                            "Price":float})
print(df)

输出:

数据类型改变

示例 5:如果您有未知值,则可以使用参数“ na_values ”处理它。它将提到的未知值转换为“ NaN

Python3

import pandas as pd
df = pd.read_excel('sample.xlsx', 
                   na_values =['item1', 
                               'item2'])
print(df)

输出:

具有 NaN 值的数据框