📅  最后修改于: 2023-12-03 15:12:18.903000             🧑  作者: Mango
在数据处理中,我们经常需要对表格进行筛选、过滤,以得到所需的数据。本文主要介绍如何通过编程来实现过滤单列物料表。
本文所述的过滤单列物料表是一个包含多行、单列的表格。我们需要按照给定的关键字,对这个单独的列进行筛选,以获取所有包含该关键字的行。
我们通常使用Pandas库来读取数据。假设我们的数据文件名为data.csv
,我们可以使用以下代码来读取数据:
import pandas as pd
data = pd.read_csv('data.csv')
我们要过滤的列称为“Material”。我们可以使用Pandas的str.contains()函数来匹配包含关键字的行,并将其保留在数据集中。下面的代码演示了如何使用str.contains()函数来过滤数据:
keyword = 'keyword' # 关键字
material_column = 'Material' # 过滤列名
filtered_data = data[data[material_column].str.contains(keyword, case=False)]
在代码中,我们首先指定要过滤的列名为Material
。然后,我们使用str.contains()
函数来匹配包含关键字keyword
的行。case=False
表示对大小写不敏感。最后,我们将结果保存在变量filtered_data
中。
我们可以使用to_csv()
函数将过滤后的结果保存为新文件。下面的代码演示了如何输出结果:
output_filename = 'filtered_data.csv' # 输出文件名
filtered_data.to_csv(output_filename, index=False, encoding='utf-8-sig')
在代码中,我们首先指定要输出的文件名为filtered_data.csv
。然后,我们使用to_csv()
函数将结果保存在文件中。index=False
表示不保留索引列,encoding='utf-8-sig'
表示使用UTF-8编码保存文件。
以下是完整的代码片段,你可以根据需求进行修改:
import pandas as pd
data = pd.read_csv('data.csv')
keyword = 'keyword' # 关键字
material_column = 'Material' # 过滤列名
filtered_data = data[data[material_column].str.contains(keyword, case=False)]
output_filename = 'filtered_data.csv' # 输出文件名
filtered_data.to_csv(output_filename, index=False, encoding='utf-8-sig')
以上就是如何通过编程来实现过滤单列物料表的方法,希望能对大家有所帮助。