一、集合(set)的定义

1、定义

           set 和 dict一样,只是没有 value,相当于 dict 的 key 集合。由于 dict 中的 key 不能重复,所以,在 set 中没有重复的元素。故集合(set)是一个无序的不重复元素序列。

2、集合的格式:

  • 集合名 = {元素1 , 元素2 , 元素3 , ... ...}(常用)  
  • 集合名 = set( 元素 )

3、集合的特点:

  • 创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典;
  • set 里边的元素是不可重复的,所以集合可用于元素去重(如:列表去重);
  • set 是无序的,支持并、交、差及对称差等数学运算, 但由于 set 不记录元素位置,因此不支持索引、分片等类序列的操作。
  • set 不能嵌套,不能存可以改变的数据类型,如列表,字典;可以存数字、字符串、元组;
  • set 和 dict 的唯一区别仅在于没有存储对应的 value,但是,set 的原理和 dict 一样,所以,同样不可以放入可变对象,因为无法判断两个可变对象是否相等,也就无法保证 set 内部“不会有重复元素”。

 集合的特点也就是我们接下来要对集合进行基本操作的基础。

 二、集合的基本操作

1、创建集合

#创建一个空集合时,只能使用s=set(),因为s={}创建的是空字典
set0 = set()  
#创建一个数值集合,由此我们也可以看出集合可自动去重
set1 = set([1,2,3,4])                                 #故set不能存列表,会将其自动转化为set
set2 = {1,2,3,4}
#创建一个字符集合
set3= set("HelloWorld!")
#set和dict一样,只是没有value,相当于dict的key集合。
set4 = set({'name':'zhangsan','age':20,'weigh':50})   #故set不能存字典,会将其自动转化为set

print('set0:',set0,type(set0))
print('set1:',set1,type(set1))
print('set2:',set2,type(set2))
print('set3:',set3,type(set3))
print('set4:',set4,type(set4))

运算结果:
set0: set() <class 'set'>
set1: {1, 2, 3, 4} <class 'set'>
set2: {1, 2, 3, 4} <class 'set'>
set3: {'o', 'r', 'W', 'd', '!', 'H', 'e', 'l'} <class 'set'>   #打印的结果是去重后的结果
set4: {'weigh', 'name', 'age'} <class 'set'>

2、去重

也可实现去除掉列表中的重复元素

#集合去重
set1={1,2,3,4,5,2}
print("set1去重后:",set1)
#列表去重
list1 = [3,6,9,4,5,3,5,6,7]
new_list = list(set(list1))
print("list1去重后:",new_list)

运行结果:
set1去重后: {1, 2, 3, 4, 5}
list1去重后: [3, 4, 5, 6, 7, 9]

3、集合元素的增、删以及判断元素是否在集合中存在

set 是无序的,  不记录元素的位置,因此不支持索引、分片等类序列的操作。

3.1> 增加元素

set.add(x):将元素 x 添加到集合 set 中,如果元素已存在,则不进行任何操作。

set1 = {"Google", "Runoob", "Taobao"}
set1.add("Facebook")
print(set1)

运行结果:
{'Facebook', 'Google', 'Taobao', 'Runoob'}

set.update(x):参数可以是列表,元组,字典等;x 可以有多个,用逗号分开。

set1 = {"Google", "Runoob", "Taobao"}
set1.update((9,0))
print(set1)
set1.update({1,3})
print(set1)
set1.update([1,4],[5,6])  
print(set1)

运行结果:
{0, 'Runoob', 9, 'Taobao', 'Google'}
{0, 1, 3, 'Runoob', 9, 'Taobao', 'Google'}
{0, 1, 3, 4, 5, 'Runoob', 6, 9, 'Taobao', 'Google'}

3.2> 删除元素

set.remove(x):将元素 x 从集合 s 中移除,如果元素不存在,则会发生错误。

set1 = {"Google", "Runoob", "Taobao"}
set1.remove("Taobao")
print(set1)
print('-------------------------------')
set1.remove("Facebook")   # 不存在会发生错误

运行结果:
{'Google', 'Runoob'}
-------------------------------
Traceback (most recent call last):
  File "D:\st13\python\1.14\lx.py", line 5, in <module>
    set1.remove("Facebook")   # 不存在会发生错误
KeyError: 'Facebook'

set.discard(x):移除集合中的元素,且如果元素不存在,不会发生错误。

set1 = {"Google", "Runoob", "Taobao"}
set1.discard("Runoob")
print(set1)
print('---------------------')
set1.discard("Facebook")  #不存在不会发生错误
print(set1)

运行结果:
{'Google', 'Taobao'}
---------------------
{'Google', 'Taobao'}

set.pop():随机删除集合中的一个元素,多次执行测试结果都不一样。

set1 = {"Google", "Runoob", "Taobao", "Facebook"}
x = set1.pop()
print(x)       #随机删除了'Google'
print(set1)

运行结果:
Google
{'Taobao', 'Facebook', 'Runoob'}

然而在交互模式(cmd命令下),pop 是删除集合的第一个元素(排序后的集合的第一个元素)。

set.clear():清空集合

set1 = {"Google", "Runoob", "Taobao"}
set1.clear()
print(set1)

运行结果:
set()

4、判断元素是否在集合中存在

x in set:判断元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。

set1 = {"Google", "Runoob", "Taobao"}
print("Runoob" in set1)
print("Facebook" in set1)

运行结果:
True
False

5、计算集合元素个数

len(set):计算集合 s 元素个数。

set1 = {"Google", "Runoob", "Taobao"}
print(len(set1))

运行结果:
3

三、集合的运算操作

即集合的最基本操作,如集合取交集(&)、并集(|)、取差集、判断一个集合是不是另一个集合的子集或者父集等。

a={1,3,4,2,5}
b={1,2,3,6,7}

1、取交集:& / intersection()

set1 = {1,3,4,2,5}
set2 = {1,2,3,6,7}
a = set1 & set2
print(a)
b = set1.intersection(set2)
print(b)

运行结果:
{1, 2, 3}
{1, 2, 3}

2、取并集:| / union()

set1 = {1,3,4,2,5}
set2 = {1,2,3,6,7}
a = set1 | set2
print(a)
b = set1.union(set2)
print(b)

运行结果:
{1, 2, 3, 4, 5, 6, 7}
{1, 2, 3, 4, 5, 6, 7}

3、异或:^ / symmertric_difference(),对称差集,即去掉两个集合的共同部分

set1 = {1,3,4,2,5}
set2 = {1,2,3,6,7}
a = set1 ^ set2
print(a)   
b = set1.symmetric_difference(set2)
print(b)

运行结果:
{4, 5, 6, 7}
{4, 5, 6, 7}

4、差集:- / difference()

set1 = {1,3,4,2,5}
set2 = {1,2,3,6,7}
a = set1 - set2      #set1减去set1与set2的交集
print(a)  
b=set1.difference(set2)
print(b)

运行结果:
{4, 5}
{4, 5}

5、子集:issubset(子集)/issuperset(父集),返回的是布尔值

set1 = {1,2,3,4,5}
set2 = {1,3,5}
a =set2.issubset(set1)   #set2是set1的子集
print(a)
b=set1.issuperset(set2)  #set1是set2的父集
print(b)

运行结果:
True
True

四、附集合内置方法完整列表

方法描述
add()为集合添加元素
clear()移除集合中的所有元素
copy()拷贝一个集合
difference()返回多个集合的差集
difference_update()移除集合中的元素,该元素在指定的集合也存在。
discard()删除集合中指定的元素
intersection()返回集合的交集
intersection_update()删除集合中的元素,该元素在指定的集合中不存在。
isdisjoint()判断两个集合是否包含相同的元素,如果没有返回 True,否则返回 False。
issubset()判断指定集合是否为该方法参数集合的子集。
issuperset()判断该方法的参数集合是否为指定集合的子集
pop()随机移除元素
remove()移除指定元素
symmetric_difference()返回两个集合中不重复的元素集合。
symmetric_difference_update()移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。
union()返回两个集合的并集
update()给集合添加元素
Logo

旨在为数千万中国开发者提供一个无缝且高效的云端环境,以支持学习、使用和贡献开源项目。

更多推荐