百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

Python进阶-day18: 性能优化

bigegpt 2025-05-14 12:00 10 浏览

目标

  • 理解性能优化的意义,学会识别代码中的性能瓶颈。
  • 掌握使用 timeit 模块测量代码执行时间的方法。
  • 比较列表推导式与传统循环的性能差异。
  • 通过优化排序算法案例,实践性能优化的具体方法。

概念

性能优化是指通过改进代码结构、算法或工具,减少程序的运行时间或资源消耗。以下是关键概念:

  1. 性能优化的重要性用户体验:快速响应的程序提升用户满意度(如网页加载速度)。 资源节约:优化后的代码减少 CPU、内存等资源占用,降低成本。 可扩展性:高性能代码能处理更大规模的数据或并发请求。 场景示例:在 Web 开发中,优化后端 API 响应时间可显著提升用户体验;在机器学习中,优化算法可缩短模型训练时间。
  2. timeit 模块: Python 内置模块,用于精确测量小段代码的执行时间。 优点:自动运行多次取平均值,减少随机误差。 用法:通过 timeit.timeit() 或命令行运行,适合比较不同实现的性能。
  3. 列表推导式 vs 循环: 列表推导式(List Comprehension)是 Python 的高级语法,简洁且通常比循环快。 原因:推导式在 C 层实现,减少了 Python 解释器的开销。 适用场景:适合简单的列表生成操作,但复杂逻辑仍需循环。
  4. 排序算法优化: 排序是常见任务,优化排序算法(如从冒泡排序到快速排序)可显著提升性能。 内置函数(如 sorted() 或 list.sort())基于 Timsort 算法,性能优于手写算法。 优化策略:选择合适的算法、减少不必要的操作、利用内置方法。

案例:性能优化的实践

以下通过三个案例,展示性能优化的具体方法,并使用 timeit 测量效果。

案例 1:使用 timeit 测量代码性能

目标:比较两种生成平方数列表的方法(循环 vs 列表推导式)。

python

import timeit

# 方法 1:使用循环生成平方数列表
def square_loop(n):
    result = []
    for i in range(n):
        result.append(i ** 2)
    return result

# 方法 2:使用列表推导式生成平方数列表
def square_comprehension(n):
    return [i ** 2 for i in range(n)]

# 使用 timeit 测量性能
n = 10000
loop_time = timeit.timeit(lambda: square_loop(n), number=1000)
comp_time = timeit.timeit(lambda: square_comprehension(n), number=1000)

# 输出结果
print(f"循环耗时: {loop_time:.4f} 秒")
print(f"列表推导式耗时: {comp_time:.4f} 秒")
print(f"列表推导式比循环快: {(loop_time - comp_time) / loop_time * 100:.2f}%")

注释

  • timeit.timeit(lambda: square_loop(n), number=1000):运行 1000 次 square_loop,返回总耗时。
  • lambda 用于包装函数,防止直接调用影响测量。
  • 结果通常显示列表推导式比循环快 30%-50%,因其在 C 层优化。

输出示例

循环耗时: 0.2688 秒
列表推导式耗时: 0.2377 秒
列表推导式比循环快: 11.56%

优化意义:在处理大规模数据时,列表推导式的性能优势可显著减少运行时间,适用于数据预处理等场景。


案例 2:列表推导式与循环的性能差异

目标:优化一个过滤偶数的任务,比较循环和推导式的性能。

python

import timeit

# 方法 1:使用循环过滤偶数
def filter_even_loop(numbers):
    result = []
    for num in numbers:
        if num % 2 == 0:
            result.append(num)
    return result

# 方法 2:使用列表推导式过滤偶数
def filter_even_comprehension(numbers):
    return [num for num in numbers if num % 2 == 0]

# 准备测试数据
numbers = list(range(10000))

# 测量性能
loop_time = timeit.timeit(lambda: filter_even_loop(numbers), number=1000)
comp_time = timeit.timeit(lambda: filter_even_comprehension(numbers), number=1000)

# 输出结果
print(f"循环过滤耗时: {loop_time:.4f} 秒")
print(f"列表推导式过滤耗时: {comp_time:.4f} 秒")
print(f"列表推导式比循环快: {(loop_time - comp_time) / loop_time * 100:.2f}%")

注释

  • filter_even_loop 使用传统循环,逐个检查并添加偶数。
  • filter_even_comprehension 用推导式实现相同逻辑,代码更简洁。
  • timeit 运行 1000 次以确保结果稳定。

输出示例

循环过滤耗时: 0.1764 秒
列表推导式过滤耗时: 0.1608 秒
列表推导式比循环快: 8.85%

优化意义:列表推导式不仅提升性能,还提高代码可读性,适合快速过滤或转换数据。


案例 3:优化排序算法

目标:比较冒泡排序、快速排序和内置 sorted() 的性能。

python

import timeit
import random

# 方法 1:冒泡排序
def bubble_sort(arr):
    n = len(arr)
    for i in range(n):
        for j in range(0, n - i - 1):
            if arr[j] > arr[j + 1]:
                arr[j], arr[j + 1] = arr[j + 1], arr[j]
    return arr

# 方法 2:快速排序
def quick_sort(arr):
    if len(arr) <= 1:
        return arr
    pivot = arr[len(arr) // 2]
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    return quick_sort(left) + middle + quick_sort(right)

# 方法 3:内置 sorted() 函数
def python_sorted(arr):
    return sorted(arr)

# 准备测试数据
random.seed(42)
data = [random.randint(1, 1000) for _ in range(1000)]

# 测量性能
bubble_time = timeit.timeit(lambda: bubble_sort(data.copy()), number=10)
quick_time = timeit.timeit(lambda: quick_sort(data.copy()), number=10)
sorted_time = timeit.timeit(lambda: python_sorted(data.copy()), number=10)

# 输出结果
print(f"冒泡排序耗时: {bubble_time:.4f} 秒")
print(f"快速排序耗时: {quick_time:.4f} 秒")
print(f"内置 sorted 耗时: {sorted_time:.4f} 秒")
print(f"内置 sorted 比冒泡排序快: {(bubble_time - sorted_time) / bubble_time * 100:.2f}%")

注释

  • bubble_sort:时间复杂度 O(n^2),适合小数据集,但性能差。
  • quick_sort:时间复杂度 O(n log n),效率较高,但递归实现可能增加内存开销。
  • python_sorted:基于 Timsort 算法,结合插入排序和归并排序,性能最佳。
  • data.copy() 确保每次测试使用相同数据,避免排序修改原列表。

输出示例

冒泡排序耗时: 0.1957 秒
快速排序耗时: 0.0049 秒
内置 sorted 耗时: 0.0004 秒
内置 sorted 比冒泡排序快: 99.82%

优化意义

  • 冒泡排序在处理 1000 元素时已明显慢于快速排序和内置 sorted()。
  • 内置 sorted() 利用 C 语言实现和 Timsort 算法,性能远超手写算法。
  • 在实际开发中,优先使用内置函数,除非有特殊需求。

  • 性能优化的重要性:通过案例可见,优化后的代码(如列表推导式、快速排序、内置函数)可将运行时间缩短数倍甚至数百倍。这在大数据处理、实时应用中至关重要。
  • 关键方法
  • 使用 timeit 精确测量性能,找到 瓶颈。
  • 优先选择列表推导式替代简单循环。
  • 利用内置函数(如 sorted())替代手写算法。
  • 实践建议
  • 编写代码时,先确保功能正确,再针对性能瓶颈优化。
  • 对于复杂任务,结合算法优化和工具(如 NumPy、Cython)进一步提升性能。

通过以上案例,开发者可以掌握性能优化的核心技能,并在实际项目中应用这些方法提升代码效率。

相关推荐

当Frida来“敲”门(frida是什么)

0x1渗透测试瓶颈目前,碰到越来越多的大客户都会将核心资产业务集中在统一的APP上,或者对自己比较重要的APP,如自己的主业务,办公APP进行加壳,流量加密,投入了很多精力在移动端的防护上。而现在挖...

服务端性能测试实战3-性能测试脚本开发

前言在前面的两篇文章中,我们分别介绍了性能测试的理论知识以及性能测试计划制定,本篇文章将重点介绍性能测试脚本开发。脚本开发将分为两个阶段:阶段一:了解各个接口的入参、出参,使用Python代码模拟前端...

Springboot整合Apache Ftpserver拓展功能及业务讲解(三)

今日分享每天分享技术实战干货,技术在于积累和收藏,希望可以帮助到您,同时也希望获得您的支持和关注。架构开源地址:https://gitee.com/msxyspringboot整合Ftpserver参...

Linux和Windows下:Python Crypto模块安装方式区别

一、Linux环境下:fromCrypto.SignatureimportPKCS1_v1_5如果导包报错:ImportError:Nomodulenamed'Crypt...

Python 3 加密简介(python des加密解密)

Python3的标准库中是没多少用来解决加密的,不过却有用于处理哈希的库。在这里我们会对其进行一个简单的介绍,但重点会放在两个第三方的软件包:PyCrypto和cryptography上,我...

怎样从零开始编译一个魔兽世界开源服务端Windows

第二章:编译和安装我是艾西,上期我们讲述到编译一个魔兽世界开源服务端环境准备,那么今天跟大家聊聊怎么编译和安装我们直接进入正题(上一章没有看到的小伙伴可以点我主页查看)编译服务端:在D盘新建一个文件夹...

附1-Conda部署安装及基本使用(conda安装教程)

Windows环境安装安装介质下载下载地址:https://www.anaconda.com/products/individual安装Anaconda安装时,选择自定义安装,选择自定义安装路径:配置...

如何配置全世界最小的 MySQL 服务器

配置全世界最小的MySQL服务器——如何在一块IntelEdison为控制板上安装一个MySQL服务器。介绍在我最近的一篇博文中,物联网,消息以及MySQL,我展示了如果Partic...

如何使用Github Action来自动化编译PolarDB-PG数据库

随着PolarDB在国产数据库领域荣膺桂冠并持续获得广泛认可,越来越多的学生和技术爱好者开始关注并涉足这款由阿里巴巴集团倾力打造且性能卓越的关系型云原生数据库。有很多同学想要上手尝试,却卡在了编译数据...

面向NDK开发者的Android 7.0变更(ndk android.mk)

订阅Google官方微信公众号:谷歌开发者。与谷歌一起创造未来!受Android平台其他改进的影响,为了方便加载本机代码,AndroidM和N中的动态链接器对编写整洁且跨平台兼容的本机...

信创改造--人大金仓(Kingbase)数据库安装、备份恢复的问题纪要

问题一:在安装KingbaseES时,安装用户对于安装路径需有“读”、“写”、“执行”的权限。在Linux系统中,需要以非root用户执行安装程序,且该用户要有标准的home目录,您可...

OpenSSH 安全漏洞,修补操作一手掌握

1.漏洞概述近日,国家信息安全漏洞库(CNNVD)收到关于OpenSSH安全漏洞(CNNVD-202407-017、CVE-2024-6387)情况的报送。攻击者可以利用该漏洞在无需认证的情况下,通...

Linux:lsof命令详解(linux lsof命令详解)

介绍欢迎来到这篇博客。在这篇博客中,我们将学习Unix/Linux系统上的lsof命令行工具。命令行工具是您使用CLI(命令行界面)而不是GUI(图形用户界面)运行的程序或工具。lsoflsof代表&...

幻隐说固态第一期:固态硬盘接口类别

前排声明所有信息来源于网络收集,如有错误请评论区指出更正。废话不多说,目前固态硬盘接口按速度由慢到快分有这几类:SATA、mSATA、SATAExpress、PCI-E、m.2、u.2。下面我们来...

新品轰炸 影驰SSD多款产品登Computex

分享泡泡网SSD固态硬盘频道6月6日台北电脑展作为全球第二、亚洲最大的3C/IT产业链专业展,吸引了众多IT厂商和全球各地媒体的热烈关注,全球存储新势力—影驰,也积极参与其中,为广大玩家朋友带来了...