百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

Introduction to Python Sets 集合介绍

bigegpt 2025-04-30 15:26 6 浏览

What is a Set in Python?

In Python, a set is an unordered (无序的) collection of unique (唯一的) elements. Unlike lists or tuples, sets do not allow duplicate (重复的) values, and their elements have no fixed position. Sets are defined using curly braces {} or the set() function. They are useful for tasks like removing duplicates from a list or checking membership (成员关系) efficiently.

Create a Set

You can create a set in two ways:

  1. Using {} with elements separated by commas:
# A set of fruits (no duplicates)
fruits = {"apple", "banana", "cherry", "apple"}  # "apple" appears only once
print(fruits)  # Output: {'apple', 'banana', 'cherry'}
  1. Using the set() function (useful for converting other data types like lists to sets):
# Convert a list to a set to remove duplicates
numbers = [1, 2, 2, 3, 4, 4, 4]
unique_numbers = set(numbers)
print(unique_numbers)  # Output: {1, 2, 3, 4}

# Create an empty set (note: {} creates a dictionary, not an empty set)
empty_set = set()

Important Features of Sets

  • Unordered: Elements do not have a specific order, so you cannot access them by index.
  • Unique: Each element appears only once; duplicate values are automatically removed.
  • Mutable (可变的): You can add or remove elements after creating the set (but the elements themselves must be immutable, like numbers or strings).

Check if an Element Exists

Use the in keyword to check if an element is present in a set:

fruits = {"apple", "banana", "cherry"}
print("banana" in fruits)  # Output: True
print("grape" in fruits)  # Output: False

Add Elements to a Set

  • add(): Adds a single element to the set.
fruits = {"apple", "banana"}
fruits.add("cherry")
print(fruits)  # Output: {'apple', 'banana', 'cherry'}
  • update(): Adds multiple elements (from another set, list, or tuple).
vegetables = {"carrot", "potato"}
fruits.update(vegetables)  # Add all elements from vegetables set
fruits.update(["orange", "grape"])  # Add elements from a list
print(fruits)  # Output: {'apple', 'banana', 'cherry', 'carrot', 'potato', 'orange', 'grape'}

Remove Elements from a Set

  • remove(value): Removes a specific element; raises an error if the element does not exist.
fruits = {"apple", "banana", "cherry"}
fruits.remove("banana")
print(fruits)  # Output: {'apple', 'cherry'}
# fruits.remove("grape")  # This will cause a KeyError
  • discard(value): Removes an element if it exists; does nothing if the element is not found.
fruits.discard("grape")  # No error even if "grape" is not present
  • pop(): Removes and returns a random element (since sets are unordered, the removed element is unpredictable).
random_fruit = fruits.pop()
print(random_fruit)  # Output: e.g., 'apple' (varies each time)
print(fruits)  # Output: {'cherry'} (if 'apple' was removed)
  • clear(): Removes all elements from the set.
fruits.clear()
print(fruits)  # Output: set()

Set Operations

Sets support mathematical operations like union (并集), intersection (交集), difference (差集), and symmetric difference (对称差集).

  1. Union (∪): Combines elements from two sets (duplicates removed).
set1 = {1, 2, 3}
set2 = {3, 4, 5}
union_set = set1.union(set2)  # or set1 | set2
print(union_set)  # Output: {1, 2, 3, 4, 5}
  1. Intersection (∩): Returns elements common to both sets.
intersection_set = set1.intersection(set2)  # or set1 & set2
print(intersection_set)  # Output: {3}
  1. Difference (-): Returns elements in the first set but not in the second.
difference_set = set1.difference(set2)  # or set1 - set2
print(difference_set)  # Output: {1, 2} (elements in set1 but not set2)
  1. Symmetric Difference (⊕): Returns elements in either set but not in both.
symmetric_diff_set = set1.symmetric_difference(set2)  # or set1 ^ set2
print(symmetric_diff_set)  # Output: {1, 2, 4, 5}

Loop Through a Set

You can use a for loop to iterate over the elements in a set (order is not guaranteed):

fruits = {"apple", "banana", "cherry"}
for fruit in fruits:
    print(fruit)

Possible output (order may vary):

banana
apple
cherry

Set vs. List vs. Tuple: Key Differences

Feature

Set

List

Tuple

Order (顺序)

Unordered

Ordered

Ordered

Duplicates (重复项)

Not allowed

Allowed

Allowed

Mutability (可变性)

Mutable (can add/remove items)

Mutable

Immutable

Syntax (语法)

{} or set()

[]

()

Use Cases

Remove duplicates, membership checks

Dynamic lists, ordered data

Fixed records, fast iteration

Example: Practical Use of Sets

Use Case 1: Remove Duplicates from a List
Suppose you have a list of scores with duplicates and want unique values:

scores = [85, 90, 85, 95, 90, 85]
unique_scores = set(scores)
print(unique_scores)  # Output: {85, 90, 95}

Use Case 2: Find Common Students in Two Classes

class1 = {"Alice", "Bob", "Charlie"}
class2 = {"Bob", "David", "Eve"}
common_students = class1.intersection(class2)
print(common_students)  # Output: {"Bob"}

Python集合介绍

什么是Python中的集合?

在Python中,**集合(set)**是一种无序的(unordered)唯一元素(unique elements)集合。与列表或元组不同,集合不允许重复(duplicate)值,且元素没有固定顺序。集合用花括号{}或set()函数定义。它们适用于从列表中删除重复项或高效检查成员关系(membership)等任务。

创建集合

创建集合有两种方式:

  1. 使用{}并以逗号分隔元素:
# 水果集合(无重复项)
fruits = {"apple", "banana", "cherry", "apple"}  # "apple"仅出现一次
print(fruits)  # 输出:{'apple', 'banana', 'cherry'}
  1. 使用set()函数(适用于将列表等其他数据类型转换为集合):
# 将列表转换为集合以删除重复项
numbers = [1, 2, 2, 3, 4, 4, 4]
unique_numbers = set(numbers)
print(unique_numbers)  # 输出:{1, 2, 3, 4}

# 创建空集合(注意:{}创建的是字典,不是空集合)
empty_set = set()

集合的重要特性

  • 无序性:元素没有特定顺序,因此不能通过索引访问。
  • 唯一性:每个元素仅出现一次,重复值会被自动删除。
  • 可变性(Mutable):可以在创建后添加或删除元素(但元素本身必须是不可变的,如数字或字符串)。

检查元素是否存在

使用in关键字检查元素是否在集合中:

fruits = {"apple", "banana", "cherry"}
print("banana" in fruits)  # 输出:True
print("grape" in fruits)  # 输出:False

向集合中添加元素

  • add():向集合中添加单个元素。
fruits = {"apple", "banana"}
fruits.add("cherry")
print(fruits)  # 输出:{'apple', 'banana', 'cherry'}
  • update():添加多个元素(来自另一个集合、列表或元组)。
vegetables = {"carrot", "potato"}
fruits.update(vegetables)  # 添加vegetables集合中的所有元素
fruits.update(["orange", "grape"])  # 添加列表中的元素
print(fruits)  # 输出:{'apple', 'banana', 'cherry', 'carrot', 'potato', 'orange', 'grape'}

从集合中删除元素

  • remove(value):删除指定元素;若元素不存在则抛出错误。
fruits = {"apple", "banana", "cherry"}
fruits.remove("banana")
print(fruits)  # 输出:{'apple', 'cherry'}
# fruits.remove("grape")  # 这会导致KeyError错误
  • discard(value):若元素存在则删除;若不存在则不执行任何操作。
fruits.discard("grape")  # 即使"grape"不存在也不会报错
  • pop():删除并返回一个随机元素(由于集合无序,删除的元素不可预测)。
random_fruit = fruits.pop()
print(random_fruit)  # 输出:例如'apple'(每次运行结果可能不同)
print(fruits)  # 输出:{'cherry'}(假设删除了'apple')
  • clear():清空集合中的所有元素。
fruits.clear()
print(fruits)  # 输出:set()

集合运算

集合支持并集(union)、交集(intersection)、差集(difference)和对称差集(symmetric difference)等数学运算。

  1. 并集(∪):合并两个集合的元素(去除重复项)。
set1 = {1, 2, 3}
set2 = {3, 4, 5}
union_set = set1.union(set2)  # 或 set1 | set2
print(union_set)  # 输出:{1, 2, 3, 4, 5}
  1. 交集(∩):返回两个集合的共同元素。
intersection_set = set1.intersection(set2)  # 或 set1 & set2
print(intersection_set)  # 输出:{3}
  1. 差集(-):返回第一个集合中存在但第二个集合中不存在的元素。
difference_set = set1.difference(set2)  # 或 set1 - set2
print(difference_set)  # 输出:{1, 2}(set1中有但set2中没有的元素)
  1. 对称差集(⊕):返回在任一集合中存在但不同时存在的元素。
symmetric_diff_set = set1.symmetric_difference(set2)  # 或 set1 ^ set2
print(symmetric_diff_set)  # 输出:{1, 2, 4, 5}

遍历集合

可以使用for循环遍历集合中的元素(顺序不固定):

fruits = {"apple", "banana", "cherry"}
for fruit in fruits:
    print(fruit)

可能的输出(顺序可能不同):

banana
apple
cherry

集合 vs. 列表 vs. 元组:主要区别

特性

集合(Set)

列表(List)

元组(Tuple)

顺序(Order)

无序(Unordered)

有序(Ordered)

有序(Ordered)

重复项(Duplicates)

不允许(Not allowed)

允许(Allowed)

允许(Allowed)

可变性(Mutability)

可变(可添加/删除元素)

可变(Mutable)

不可变(Immutable)

语法(Syntax)

{} 或 set()

[]

()

使用场景

去重、成员检查

动态列表、有序数据

固定记录、快速遍历

示例:集合的实际应用

场景1:从列表中删除重复项
假设你有一个包含重复分数的列表,需要获取唯一值:

scores = [85, 90, 85, 95, 90, 85]
unique_scores = set(scores)
print(unique_scores)  # 输出:{85, 90, 95}

场景2:查找两个班级的共同学生

class1 = {"Alice", "Bob", "Charlie"}
class2 = {"Bob", "David", "Eve"}
common_students = class1.intersection(class2)
print(common_students)  # 输出:{"Bob"}

专业词汇和不常用词汇表

set, /set/, 集合
unordered, /n'rdrd/, 无序的
unique, /ju'nik/, 唯一的
duplicate, /'duplket/, 重复的
membership, /'membrp/, 成员关系
mutable, /'mjutbl/, 可变的
union, /'junin/, 并集
intersection, /ntr'sekn/, 交集
difference, /'dfrns/, 差集
symmetric difference, /s'metrk 'dfrns/, 对称差集
iterate, /'tret/, 遍历

相关推荐

得物可观测平台架构升级:基于GreptimeDB的全新监控体系实践

一、摘要在前端可观测分析场景中,需要实时观测并处理多地、多环境的运行情况,以保障Web应用和移动端的可用性与性能。传统方案往往依赖代理Agent→消息队列→流计算引擎→OLAP存储...

warm-flow新春版:网关直连和流程图重构

本期主要解决了网关直连和流程图重构,可以自此之后可支持各种复杂的网关混合、多网关直连使用。-新增Ruoyi-Vue-Plus优秀开源集成案例更新日志[feat]导入、导出和保存等新增json格式支持...

扣子空间体验报告

在数字化时代,智能工具的应用正不断拓展到我们工作和生活的各个角落。从任务规划到项目执行,再到任务管理,作者深入探讨了这款工具在不同场景下的表现和潜力。通过具体的应用实例,文章展示了扣子空间如何帮助用户...

spider-flow:开源的可视化方式定义爬虫方案

spider-flow简介spider-flow是一个爬虫平台,以可视化推拽方式定义爬取流程,无需代码即可实现一个爬虫服务。spider-flow特性支持css选择器、正则提取支持JSON/XML格式...

solon-flow 你好世界!

solon-flow是一个基础级的流处理引擎(可用于业务规则、决策处理、计算编排、流程审批等......)。提供有“开放式”驱动定制支持,像jdbc有mysql或pgsql等驱动,可...

新一代开源爬虫平台:SpiderFlow

SpiderFlow:新一代爬虫平台,以图形化方式定义爬虫流程,不写代码即可完成爬虫。-精选真开源,释放新价值。概览Spider-Flow是一个开源的、面向所有用户的Web端爬虫构建平台,它使用Ja...

通过 SQL 训练机器学习模型的引擎

关注薪资待遇的同学应该知道,机器学习相关的岗位工资普遍偏高啊。同时随着各种通用机器学习框架的出现,机器学习的门槛也在逐渐降低,训练一个简单的机器学习模型变得不那么难。但是不得不承认对于一些数据相关的工...

鼠须管输入法rime for Mac

鼠须管输入法forMac是一款十分新颖的跨平台输入法软件,全名是中州韵输入法引擎,鼠须管输入法mac版不仅仅是一个输入法,而是一个输入法算法框架。Rime的基础架构十分精良,一套算法支持了拼音、...

Go语言 1.20 版本正式发布:新版详细介绍

Go1.20简介最新的Go版本1.20在Go1.19发布六个月后发布。它的大部分更改都在工具链、运行时和库的实现中。一如既往,该版本保持了Go1的兼容性承诺。我们期望几乎所...

iOS 10平台SpriteKit新特性之Tile Maps(上)

简介苹果公司在WWDC2016大会上向人们展示了一大批新的好东西。其中之一就是SpriteKitTileEditor。这款工具易于上手,而且看起来速度特别快。在本教程中,你将了解关于TileE...

程序员简历例句—范例Java、Python、C++模板

个人简介通用简介:有良好的代码风格,通过添加注释提高代码可读性,注重代码质量,研读过XXX,XXX等多个开源项目源码从而学习增强代码的健壮性与扩展性。具备良好的代码编程习惯及文档编写能力,参与多个高...

Telerik UI for iOS Q3 2015正式发布

近日,TelerikUIforiOS正式发布了Q32015。新版本新增对XCode7、Swift2.0和iOS9的支持,同时还新增了对数轴、不连续的日期时间轴等;改进TKDataPoin...

ios使用ijkplayer+nginx进行视频直播

上两节,我们讲到使用nginx和ngixn的rtmp模块搭建直播的服务器,接着我们讲解了在Android使用ijkplayer来作为我们的视频直播播放器,整个过程中,需要注意的就是ijlplayer编...

IOS技术分享|iOS快速生成开发文档(一)

前言对于开发人员而言,文档的作用不言而喻。文档不仅可以提高软件开发效率,还能便于以后的软件开发、使用和维护。本文主要讲述Objective-C快速生成开发文档工具appledoc。简介apple...

macOS下配置VS Code C++开发环境

本文介绍在苹果macOS操作系统下,配置VisualStudioCode的C/C++开发环境的过程,本环境使用Clang/LLVM编译器和调试器。一、前置条件本文默认前置条件是,您的开发设备已...