Python从序列中选择k个不重复元素

2016-09-12 董付国 Python小屋 Python小屋

昨天的文章中有个错别字,开头第一句“颜色”应为“演示”,抱歉抱歉。

Python操作高版本Excel文件:颜色、边框、合并单元格


集合中的元素不允许重复,Python集合的内部实现为此做了大量相应的优化,判断集合中是否包含某元素时比列表速度快很多。下面的代码用于返回指定范围内一定数量的不重复数字,使用集合的效率明显优于使用列表。

import random

import time


def RandomNumbers1(number, start, end):

    '''使用列表来生成number个介于start和end之间的不重复随机数'''

    data = []

    while True:

        element = random.randint(start, end)

        if element not in data:

            data.append(element)

        if len(data) == number:

            break

    return data


def RandomNumbers2(number, start, end):

    '''使用集合来生成number个介于start和end之间的不重复随机数'''

    data = set()

    while True:

        element = random.randint(start, end)

        data.add(element)

        if len(data) == number:

            return data


start = time.time()

for i in range(10000):

    d1 = RandomNumbers1(500, 1, 10000)

print('Time used:', time.time()-start)


start = time.time()

for i in range(10000):

    d2 = RandomNumbers2(500, 1, 10000)

print('Time used:', time.time()-start)

运行结果为:

Time used: 41.77738952636719

Time used: 13.330762386322021


上面的代码只是为了展示Python获取不重复元素的原理,如果在项目中需要这样一个功能的时候,还是直接使用下面的方法更好一些,random模块的sample()方法可以直接从指定序列中选取指定数量个不重复的元素

>>> import random

>>> random.sample(range(1000), 20)

[61, 538, 873, 815, 708, 609, 995, 64, 7, 719, 922, 859, 807, 464, 789, 651, 31, 702, 504, 25]


留个思考题:我给学生讲这段代码的时候,有同学修改参数进行调用,例如RandomNumbers2(500, 1, 100),结果导致死循环。你能想到原因吗?




温馨提示:单击文章顶部作者名字旁边浅蓝色的“Python小屋”进入公众号,关注后可以查看更多内容!


欢迎转发给您的朋友,或许这正是Ta需要的知识!