获取一个dict的随机样本

时间:2016-10-12 14:46:49

标签: python dictionary random python-3.4

我正在使用大字典,出于某种原因,我还需要处理该字典中的小型随机样本。我怎样才能得到这个小样本(例如长度为2)?

这是一个玩具模型:

dy={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

我需要在dy上执行一些涉及所有条目的任务。让我们说,为了简化,我需要将所有值加在一起:

s=0
for key in dy.key:
    s=s+dy[key]

现在,我还需要在随机的dy样本上执行相同的任务;为此我需要一个随机的dy键样本。我能想象的简单解决方案是

sam=list(dy.keys())[:1]

通过这种方式,我有一个字典的两个键的列表,它们在某种程度上是随机的。所以,回到可能的任务,代码中唯一需要的改变是:

s=0
for key in sam:
    s=s+dy[key]

关键是我不完全理解dy.keys是如何构建的,然后我无法预见任何未来的问题

5 个答案:

答案 0 :(得分:2)

举个例子:

dy = {'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

然后将所有值的总和更简单地表示为:

s = sum(dy.values())

然后,如果它不是内存禁止,你可以使用:

进行采样
import random

values = list(dy.values())
s = sum(random.sample(values, 2))

或者,由于random.sample可以使用类似set的对象,因此:

from operator import itemgetter
import random

s = sum(itemgetter(*random.sample(dy.keys(), 2))(dy))

或者只是使用:

s = sum(dy[k] for k in random.sample(dy.keys(), 2))

另一种方法是使用heapq,例如:

import heapq
import random

s = sum(heapq.nlargest(2, dy.values(), key=lambda L: random.random()))

答案 1 :(得分:2)

def sample_from_dict(d, sample=10):
    keys = random.sample(list(d), sample)
    values = [d[k] for k in keys]
    return dict(zip(keys, values))

答案 2 :(得分:0)

range(10)替换为numphy中的一些randome样本

{v:rows[v] for v in [list(rows.keys())[k] for k in range(10)]}

答案 3 :(得分:0)

import random
origin_dict =  {'a':1, 'b':2, 'c':3, 'd':4, 'e':5}
sample_rate = 0.3
random_keys = random.sample(list(origin_dict.keys()), int(sample_rate * len(origin_dict)))
random_values = [origin_dict[k] for k in random_keys]

sample_dict = dict(zip(random_keys, random_values))

输出:

{'d': 4, 'c': 3}

答案 4 :(得分:0)

这应该比创建一个新的 dict 并检查键是否是样本的一部分更快:

import random    
sample_n = 1000
output_dict = dict(random.sample(input_dict.items(), sample_n))