Структура данных set

set это весьма полезная структура данных. set схож по поведению со списком, за тем исключением, что множества неупорядочены и не могут содержать одинаковые значения. Это бывает очень кстати в определённых случаях. К примеру, вам может потребоваться проверить список на наличие дубликатов. Существует два типичных метода. Первый - использовать цикл for. Как-то так:

some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']

duplicates = []
for value in some_list:
    if some_list.count(value) > 1:
        if value not in duplicates:
            duplicates.append(value)

print(duplicates)
# Вывод: ['b', 'n']

Но есть и более простое решение при помощи множества. Вы можете сделать что-нибудь такое:

some_list = ['a', 'b', 'c', 'b', 'd', 'm', 'n', 'n']
duplicates = set([x for x in some_list if some_list.count(x) > 1])
print(duplicates)
# Вывод: set(['b', 'n'])

У множеств также есть несколько дополнительных методов. Вот некоторые из них:

Пересечение

Вы можете найти пересечение двух множества. Например:

valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.intersection(valid))
# Вывод: set(['red'])

Разность

Разность двух множеств можно найти следующим методом:

valid = set(['yellow', 'red', 'blue', 'green', 'black'])
input_set = set(['red', 'brown'])
print(input_set.difference(valid))
# Вывод: set(['brown'])

Множества также можно создавать с помощью новой нотации:

a_set = {'red', 'blue', 'green'}
print(type(a_set))
# Вывод: <type 'set'>

Существуют и другими методы. Рекомендую ознакомиться с ними в официальной документации.

Last updated