📜  Python读取Excel文件

📅  最后修改于: 2020-10-28 01:00:22             🧑  作者: Mango

Python读取Excel文件

Excel是由Microsoft开发的电子表格应用程序。它是一种易于使用的工具,可以组织,分析和存储表中的数据。它在全世界许多不同的应用中得到广泛使用。从分析师到首席执行官,各种专业人员都使用Excel进行快速统计和严重的数据处理。

Excel文件

Excel电子表格文档称为工作簿,该工作簿保存在扩展名为.xlsx的文件中。电子表格的第一行主要保留给标题,而第一列则标识采样单位。每个工作簿可以包含多个工作表,这些工作表也称为工作表。特定列和行上的框称为单元格,每个单元格可以包含数字或文本值。带有数据的单元格网格构成一张纸。

活动工作表定义为在关闭Excel之前用户当前正在查看或最近浏览过的工作表。

从Excel文件读取

首先,您需要编写命令来安装xlrd模块。

pip install xlrd  

创建工作簿

一个工作簿包含excel文件中的所有数据。您可以从头开始创建新工作簿,也可以从已经存在的excel文件中轻松创建工作簿。

输入文件

我们已经拍摄了工作簿的快照。

# Import the xlrd module    
import xlrd   
    
# Define the location of the file   
loc = ("path of file")   
    
# To open the Workbook   
wb = xlrd.open_workbook(loc)   
sheet = wb.sheet_by_index(0)   
    
# For row 0 and column 0   
sheet.cell_value(0, 0)

说明:在上面的示例中,首先,我们导入了xlrd模块并定义了文件的位置。然后,我们从已经存在的excel文件中打开了工作簿。

Pamdas读取

Pandas被定义为在NumPy库顶部构建的开源库。它为用户提供快速分析,数据清理和数据准备,并支持URL的xls和xlsx扩展名。

这是一个Python软件包,提供了一种有益的数据结构,称为数据框架。

Example - 
import pandas as pd  
  
# Read the file  
data = pd.read_csv(".csv", low_memory=False)  
  
# Output the number of rows  
print("Total rows: {0}".format(len(data)))  
  
# See which headers are available  
print(list(data))  

从openpyxl读取

首先,我们需要从命令行使用pip安装openpyxl模块。

pip install openpyxl  

之后,我们需要导入模块。

我们还可以使用openpyxl从现有电子表格中读取数据。它还允许用户执行计算并添加不属于原始数据集的内容。

import openpyxl  
my_wb = openpyxl.Workbook()  
my_sheet = my_wb.active  
my_sheet_title = my_sheet.title  
print("My sheet title: " + my_sheet_title)  

输出:

My sheet title: Sheet

要了解有关openpyxl的更多信息,请访问我们的完整教程。我们已经在本教程中讨论了基本细节。