📅  最后修改于: 2023-12-03 14:46:16.459000             🧑  作者: Mango
在文件夹中找到重复文件是一个常见的问题。在这篇文章中,我们将探讨如何使用 Python 找到重复的 zip 文件。
首先,我们需要安装 os
模块来访问文件系统。
import os
接下来,我们需要指定要搜索的文件夹。在本例中,我们将搜索名为 folder_name
的文件夹,并将搜索的 zip 文件的扩展名设置为 .zip
。
folder_name = 'path/to/folder'
extension = '.zip'
现在,我们可以遍历文件夹,并将每个 zip 文件的大小和路径存储在一个字典中,以便稍后比较。
zip_files = {}
for root, dirs, files in os.walk(folder_name):
for file in files:
if file.endswith(extension):
file_path = os.path.join(root, file)
file_size = os.path.getsize(file_path)
if file_size in zip_files:
zip_files[file_size].append(file_path)
else:
zip_files[file_size] = [file_path]
最后,我们可以遍历字典中的条目,并找到具有相同大小的 zip 文件。
for file_size, file_paths in zip_files.items():
if len(file_paths) > 1:
print(f'Duplicate Zip Files with size {file_size}:')
for file_path in file_paths:
print(f'\t{file_path}')
完整代码:
import os
folder_name = 'path/to/folder'
extension = '.zip'
zip_files = {}
for root, dirs, files in os.walk(folder_name):
for file in files:
if file.endswith(extension):
file_path = os.path.join(root, file)
file_size = os.path.getsize(file_path)
if file_size in zip_files:
zip_files[file_size].append(file_path)
else:
zip_files[file_size] = [file_path]
for file_size, file_paths in zip_files.items():
if len(file_paths) > 1:
print(f'Duplicate Zip Files with size {file_size}:')
for file_path in file_paths:
print(f'\t{file_path}')
现在,您可以在 Python 中使用此代码来查找重复的 zip 文件。