百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

Python全能压缩:ZIP的压缩、解压、文件筛选与删除,一键搞定!

bigegpt 2025-01-01 18:04 4 浏览

引言:

这个方法实现了文件压缩与解压的常见操作,涵盖内容如下:

1、从文件夹创建 ZIP 文件

2、从文件夹创建 ZIP 文件(筛选特定文件)

3、解压 ZIP 文件中的所有内容

4、解压 ZIP 文件中的特定文件(筛选文件)

5、向现有 ZIP 文件中添加文件

6、从 ZIP 文件中删除文件

代码封装如下:

import os
import zipfile

class ZipFileManager:
    def __init__(self, file_path=None, unzip_file_path=None, zip_path=None):
        self.file_path = file_path   #todo 压缩源文件夹路径
        self.unzip_file_path = unzip_file_path  #todo 解压目标 ZIP 文件路径
        self.zip_path = zip_path  #todo 要操作的现有 ZIP 文件路径

    def create_zip_from_folder(self, zip_file_path):
        #todo 打开一个新的 zip 文件,使用 'w' 模式表示写入(会覆盖已存在的文件)
        with zipfile.ZipFile(zip_file_path + '.zip', 'w', zipfile.ZIP_DEFLATED) as zip_ref:
            #todo 遍历文件夹中的所有文件
            for root, _, files in os.walk(self.file_path):
                for file in files:
                    #todo 获取每个文件的完整路径
                    path = os.path.join(root, file)
                    #todo 获取文件的相对路径
                    arc_name = os.path.relpath(path, self.file_path)
                    #todo 将文件写入 ZIP 文件,arc_name 是文件在压缩包中的路径
                    zip_ref.write(path, arc_name)

    def create_zip_from_folder_with_special_files(self, zip_file_path, file_names=None, file_extensions=None):
        with zipfile.ZipFile(zip_file_path + '.zip', 'w', zipfile.ZIP_DEFLATED) as zip_ref:
            for root, _, files in os.walk(self.file_path):
                for file in files:
                    path = os.path.join(root, file)
                    file_name = os.path.basename(file)
                    #todo 如果指定了文件名,并且文件名不在列表中,则跳过该文件
                    if file_names and file_name not in file_names:
                        continue
                    #todo 如果指定了文件扩展名,并且文件的扩展名不符合,则跳过该文件
                    if file_extensions and not any(file.endswith(ext) for ext in file_extensions):
                        continue
                    #todo 获取文件的相对路径
                    arc_name = os.path.relpath(path, self.file_path)
                    #todo 将文件写入压缩包
                    zip_ref.write(path, arc_name)

    def extract_zip_all(self, extract_path):

        with zipfile.ZipFile(self.unzip_file_path, 'r') as zip_ref:
            zip_ref.extractall(extract_path)

    def extract_special_files_from_zip(self, extract_path, file_names=None, file_extensions=None):

        with zipfile.ZipFile(self.unzip_file_path, 'r') as zip_ref:
            #todo 遍历 ZIP 文件中的所有文件
            for file_info in zip_ref.infolist():
                #todo 如果指定了文件名,并且文件名不在列表中,则跳过该文件
                if file_names and file_info.filename not in file_names:
                    continue
                #todo 如果指定了文件扩展名,并且文件的扩展名不符合,则跳过该文件
                if file_extensions and not any(file_info.filename.endswith(ext) for ext in file_extensions):
                    continue
                #todo 解压符合条件的文件到指定路径
                zip_ref.extract(file_info, extract_path)

    def add_files_to_exist_zip(self, files_to_add, destination_folder=None):

        with zipfile.ZipFile(self.zip_path, 'a', zipfile.ZIP_DEFLATED) as zip_ref:
            for filepath in files_to_add:
                #todo 如果指定了目标文件夹,文件将在该文件夹内存储,否则直接保存文件
                arcname = os.path.join(destination_folder, os.path.basename(filepath)) if destination_folder else os.path.basename(filepath)
                #todo 将文件写入现有的 ZIP 文件
                zip_ref.write(filepath, arcname)

    def remove_files_from_zip(self, files_to_remove):
        files_to_remove = set(files_to_remove)  #todo 将待删除文件名列表转换为集合,确保唯一性
        temp_zip_file_path = self.zip_path + '.temp'  #todo 创建临时 ZIP 文件路径

        #todo 打开原 ZIP 文件和临时 ZIP 文件
        with zipfile.ZipFile(self.zip_path, 'r') as zip_ref, zipfile.ZipFile(temp_zip_file_path, 'w') as temp_zip_ref:
            for file_info in zip_ref.infolist():
                #todo 如果文件不在待删除列表中,则将文件写入临时 ZIP 文件
                if file_info.filename not in files_to_remove:
                    file_data = zip_ref.read(file_info.filename)
                    temp_zip_ref.writestr(file_info, file_data)

        #todo 用临时文件替换原 ZIP 文件
        os.replace(temp_zip_file_path, self.zip_path) 

if __name__ == '__main__':
    #todo 示例:创建一个 ZipFileManager 实例并执行相关方法
    file_path = r'D:\remote'  #todo 要压缩的文件夹路径
    zip_file_manager = ZipFileManager(file_path=file_path)
    
    #todo 创建 ZIP 文件,包含所有文件
    zip_file_manager.create_zip_from_folder(zip_file_path=r'D:\remote1')

    #todo 创建 ZIP 文件,包含特定文件名和扩展名的文件
    zip_file_manager.create_zip_from_folder_with_special_files(
        zip_file_path=r'D:\remote_special',
        file_names=['example.txt', 'test.pdf'],
        file_extensions=['.txt', '.pdf'])

其中需要的注意点:

路径格式:路径应使用合适的格式,确保在不同操作系统中路径分隔符正确。在 Windows 系统中路径使用反斜杠(\\ 或 /),而在 Linux 或 macOS 上使用正斜杠(/)。可以使用 os.path.join() 来确保跨平台兼容性。

权限问题:在读取或写入 ZIP 文件时,确保对目标文件有适当的读取或写入权限。如果文件正在被其他程序(如压缩软件)占用,可能会导致访问失败。

ZIP 文件的打开模式:打开 ZIP 文件时,确保使用正确的模式('r'、'w'、'a')

相关推荐

为3D手游打造, Visual Studio Unity扩展下载

IT之家(www.ithome.com):为3D手游打造,VisualStudioUnity扩展下载7月30日消息,微软正式发布升级版VisualStudioToolsforUnity扩...

由ArcMap属性字段自增引出字段计算器使用Python的技巧

1.前言前些日子有人问我ArcMap中要让某个字段的值实现自增有什么方法?我首先想到像SQLServer中对于数值型字段可以设置自增。所以我打开ArcCatalog查看发现只提供默认值,没办法只能看...

微软首次回答 HoloLens 相关问题,终于爆料了

fengo2015/04/2115:11注:本文作者张静是NVIDIAGPU架构师,微信公众号“黑客与画家”(HackerAndPainter),知乎专栏地址。欢迎各位童鞋与他交流探讨。...

C#指针的应用(c#指针类型)

C#在有限的范围内支持指针。C#的指针只不过是一个持有另一类型内存地址的变量。但是在C#中,指针只能被声明为持有值类型和数组的内存地址。与引用类型不同,指针类型不被默认的垃圾收集机制所跟踪。出于同...

C# 堆栈(Stack)(c# 堆栈中定位调用messagebox 的地方)

C#集合在C#中,堆栈(Stack)是一种后进先出(LIFO,LastInFirstOut)的数据结构。堆栈(Stack)适用于存储和按顺序处理数据,其中最新添加的元素会最先被移除。堆...

欢迎回来:Fortran意外重回流行编程语言20强榜单

TIOBE指数是用来确定一种编程语言受欢迎程度的指标之一。它并不表明哪种编程语言是最好的,也不表明哪种编程语言写的代码行数最多,而是利用在谷歌、维基百科、必应、亚马逊、YouTube等各种引擎和网站上...

C#+NET MAUI实现跨平台/终端(linux,win,ios等)解决方案

简介.NETMulti-platformAppUI(.NETMAUI)是一个跨平台的框架,用于使用C#和XAML创建移动和桌面应用程序。使用.NETMAUI,您可以用一套代码库开发可以在A...

C#代码安全红线:SQL注入防护终极方案,让你的系统固若金汤

在数字化时代,应用系统的安全性至关重要。而SQL注入攻击,长期盘踞在OWASP(OpenWebApplicationSecurityProject)漏洞榜单的前列,成为众多基于数据库的应用系统...

C# (一)状态机模式(状态机代码实现)

最近空闲,炒炒隔夜饭,以前这些模式在自己项目种应用过不少,但一直没有像别人那样写一个系列,最近年纪大了,很多东西都忘记了,特别AI的兴起,更少写代码了,反正没什么事情,自己在重写一遍吧。创建型模式(5...

C# 中 Predicate 详解(c#中的replace)

Predicate泛型委托:表示定义一组条件并确定指定对象是否符合这些条件的方法。此委托由Array和List类的几种方法使用,用于在集合中搜索元素。Predicate<T>...

C#中$的用法?(c#中&&什么意思)

文章来自AI问答。在C#中,$符号用于字符串插值(StringInterpolation)。字符串插值是C#6.0引入的一种特性,它允许你在字符串中直接嵌入表达式,而不需要使用string.For...

C#并行编程:Parallel类(c# 并行处理)

在Parallel类中提供了三个静态方法作为结构化并行的基本形式:Parallel.Invoke方法:并行执行一组委托。Parallel.For方法:执行与C#for循环等价的并行方法。Parall...

颠覆认知!用Span重构foreach循环竟让数据处理快如闪电

在C#编程的世界里,数据处理效率始终是开发者们关注的焦点。随着项目规模的扩大和数据量的激增,哪怕是细微的性能提升,都可能对整个应用的响应速度和用户体验产生深远影响。近年来,C#引入的Span<T...

Unity3D手游开发实践《腾讯桌球》客户端开发经验总结

本次分享总结,起源于腾讯桌球项目,但是不仅仅限于项目本身。虽然基于Unity3D,很多东西同样适用于Cocos。本文从以下10大点进行阐述:1.架构设计2.原生插件/平台交互3.版本与补丁4.用脚本,...

.NET 7 AOT 的使用以及 .NET 与 Go 互相调用

目录背景C#部分环境要求创建一个控制台项目体验AOT编译C#调用库函数减少体积C#导出函数C#调用C#生成的AOTGolang部分安装GCCGolang导出函数.NETC#...