什么是itertools？

itertools 是 Python 标准库中的一个模块，它提供了一系列为使用迭代器而定制的工具。它引入了一组构建块，以最少的编码工作简化了复杂迭代器的创建。

基本原理

1.count

该 count 函数生成无限的算术级数，允许创建数字序列。它的多功能性在需要连续范围的场景中使用时大放异彩。

from itertools import count

for i in count(5, 2):
    if i > 15:
        break
    print(i)

输出： 5 7 9 11 13 15

2.cycle

该 cycle 函数会永久重复给定的序列，这对于需要循环迭代的场景非常用于

from itertools import cycle

colors = ['red', 'green', 'blue']
color_cycle = cycle(colors)

for _ in range(10):
    print(next(color_cycle))

输出： red green blue red green blue red green blue red

3.repeat

该 repeat 函数生成一个迭代器，该迭代器无限期地生成指定的值。

from itertools import repeat

for i in repeat('Python', 3):
    print(i)

输出： Python Python Python

高级 itertools 技术

4.combinations以及permutations

combinations 和 permutations 函数有助于分别从给定的可迭代对象生成组合和排列。

from itertools import combinations, permutations

data = [1, 2, 3]

combs = list(combinations(data, 2))
perms = list(permutations(data, 2))

print("Combinations:", combs)
print("Permutations:", perms)

5.groupby

groupby 是一个通用函数，根据共享键对连续元素进行分组。

from itertools import groupby

data = [('a', 1), ('b', 2), ('b', 3), ('a', 4)]

grouped_data = {key: list(group) for key, group in groupby(data, key=lambda x: x[0])}

print(grouped_data)

实际应用

示例：日志分析

请考虑需要分析和分析日志文件的方案。此示例演示了按日期对日志进行分组的应用 groupby 。

from itertools import groupby

# Assuming logs are sorted by date
logs = [
    {'date': '2022-01-01', 'event': 'A'},
    {'date': '2022-01-01', 'event': 'B'},
    {'date': '2022-01-02', 'event': 'A'},
]

grouped_logs = {key: list(group) for key, group in groupby(logs, key=lambda x: x['date'])}

print(grouped_logs)

示例：数据聚合

通过申请 groupby 数据聚合来扩展您的理解。在这里，我们根据“类别”键聚合值。

from itertools import groupby

data = [
    {'category': 'A', 'value': 10},
    {'category': 'B', 'value': 20},
    {'category': 'A', 'value': 15},
]

aggregated_data = {key: sum(item['value'] for item in group) for key, group in groupby(data, key=lambda x: x['category'])}

print(aggregated_data)

相关推荐

Java 泛型大揭秘:类型参数、通配符与最佳实践: 引言在编程世界中，代码的可重用性和可维护性是至关重要的。为了实现这些目标，Java5引入了一种名为泛型（Generics）的强大功能。本文将详细介绍Java泛型的概念、优势和局限性，以及如何在...

K8s 的标签与选择器:流畅运维的秘诀: 在Kubernetes的世界里，**标签（Label）和选择器（Selector）**并不是最炫酷的技术，但却是贯穿整个集群管理与运维流程的核心机制。正是它们让复杂的资源调度、查询、自动化运维变得...

哈希Hash算法:原理、应用（哈希算法知乎）: 原作者：Linux教程，原文地址：「链接」什么是哈希算法？哈希算法（HashAlgorithm），又称为散列算法或杂凑算法，是一种将任意长度的数据输入转换为固定长度输出值的数学函数。其输出结果通常被...

C#学习:基于LLM的简历评估程序（c# 简历）: 前言在pocketflow的例子中看到了一个基于LLM的简历评估程序的例子，感觉还挺好玩的，为了练习一下C#，我最近使用C#重写了一个。准备不同的简历：image-20250528183949844查...

55顺位，砍41+14+3!季后赛也成得分王，难道他也是一名球星?: 雷霆队最不可思议的新星：一个55号秀的疯狂逆袭！你是不是也觉得NBA最底层的55号秀，就只能当饮水机管理员？今年的55号秀阿龙·威金斯恐怕要打破你的认知了！常规赛阶段，这位二轮秀就像开了窍的天才，直接...

5分钟读懂C#字典对象（c# 字典获取值）: 什么是字典对象在C#中，使用Dictionary类来管理由键值对组成的集合，这类集合被称为字典。字典最大的特点就是能够根据键来快速查找集合中的值，其键的定义不能重复，具有唯一性，相当于数组索引值，字典...

c#窗体传值（c# 跨窗体传递数据）: 在WinForm编程中我们经常需要进行俩个窗体间的传值。下面我给出了两种方法，来实现传值一、在输入数据的界面中定义一个属性，供接受数据的窗体使用1、子窗体usingSystem;usingSyst...

C#入门篇章—委托（c#委托的理解）: C#委托1.委托的定义和使用委托的作用：如果要把方法作为函数来进行传递的话，就要用到委托。委托是一个类型，这个类型可以赋值一个方法的引用。C#的委托通过delegate关键字来声明。声明委托的...

C#.NET in、out、ref详解（c#.net framework）: 简介在C#中，in、ref和out是用于修改方法参数传递方式的关键字，它们决定了参数是按值传递还是按引用传递，以及参数是否必须在传递前初始化。基本语义对比修饰符传递方式可读写性必须初始化调用...

C#广义表（广义表headtail）: 在C#中，广义表（GeneralizedList）是一种特殊的数据结构，它是线性表的推广。广义表可以包含单个元素（称为原子），也可以包含另一个广义表（称为子表）。以下是一个简单的C#广义表示例代...

「C#.NET 拾遗补漏」04:你必须知道的反射: 阅读本文大概需要3分钟。通常，反射用于动态获取对象的类型、属性和方法等信息。今天带你玩转反射，来汇总一下反射的各种常见操作，捡漏看看有没有你不知道的。获取类型的成员Type类的GetMembe...

C#启动外部程序的问题（c#怎么启动）: IT&OT的深度融合是智能制造的基石。本公众号将聚焦于PLC编程与上位机开发。除理论知识外，也会结合我们团队在开发过程中遇到的具体问题介绍一些项目经验。在使用C#开发上位机时，有时会需要启动外部的一些...

全网最狠C#面试拷问:这20道题没答出来，别说你懂.NET!: 在竞争激烈的C#开发岗位求职过程中，面试是必经的一道关卡。而一场高质量的面试，不仅能筛选出真正掌握C#和.NET技术精髓的人才，也能让求职者对自身技术水平有更清晰的认知。今天，就为大家精心准备了20道...

C#匿名方法（c#匿名方法与匿名类）: C#中的匿名方法是一种没有名称只有主体的方法，它提供了一种传递代码块作为委托参数的技术。以下是关于C#匿名方法的一些重要特点和用法：特点省略参数列表：使用匿名方法可省略参数列表，这意味着匿名方法...

C# Windows窗体(.Net Framework)知识总结: Windows窗体可大致分为Form窗体和MDI窗体，Form窗体没什么好细说的，知识点总结都在思维导图里面了，下文将围绕MDI窗体来讲述。MDI（MultipleDocumentInterfac...

一文掌握在 Python 中的 itertools

什么是itertools？

基本原理

1.count

2.cycle

3.repeat

高级 itertools 技术

4.combinations以及permutations

5.groupby

实际应用

示例：日志分析

示例：数据聚合

相关推荐

idea本地配置连接远程hadoop集群的一些网络问题解决汇总

无缓存不行?例行升级的入门级阿斯加特AN2 SSD装机点评

Ceph运维手册(基于P版本)

大数据开发前要做什么准备?8台Hadoop服务器进行集群规划前配置

Tensorflow分类loss函数总结 tensorflow绘制loss曲线

R语言学习笔记(七) -离散型数据的模型预测2

iOS Runtime详解

7 个对 Java 意义重大的性能指标，你知道几个?

Docker 命令大全（docker命令大全记录表）

服务器硬件RAID性能横评(2)（服务器常用raid技术）