搁置模块有问题吗?

时间:2009-08-25 06:56:49

标签: python shelve

使用搁置模块给了我一些令人惊讶的行为。 keys(),iter()和iteritems()不返回架子中的所有条目!这是代码:

cache = shelve.open('my.cache')
# ...
cache[url] = (datetime.datetime.today(), value)

后:

cache = shelve.open('my.cache')
urls = ['accounts_with_transactions.xml', 'targets.xml', 'profile.xml']
try:
    print list(cache.keys()) # doesn't return all the keys!
    print [url for url in urls if cache.has_key(url)]
    print list(cache.keys())
finally:
    cache.close()

这是输出:

['targets.xml']
['accounts_with_transactions.xml', 'targets.xml']
['targets.xml', 'accounts_with_transactions.xml']

之前是否有人遇到此问题,是否有解决方法而不知道所有可能的缓存键先验

2 个答案:

答案 0 :(得分:3)

根据python library reference

  

......数据库(不幸的是)也受到dbm的限制,如果使用的话 - 这意味着存储在数据库中的对象的(腌制表示)应该相当小......

这正确地再现了'bug':

import shelve

a = 'trxns.xml'
b = 'foobar.xml'
c = 'profile.xml'

urls = [a, b, c]
cache = shelve.open('my.cache', 'c')

try:
    cache[a] = a*1000
    cache[b] = b*10000
finally:
    cache.close()


cache = shelve.open('my.cache', 'c')

try:
    print cache.keys()
    print [url for url in urls if cache.has_key(url)]
    print cache.keys()
finally:
    cache.close()

输出:

[]
['trxns.xml', 'foobar.xml']
['foobar.xml', 'trxns.xml']

因此,答案是不要存储任何大的原始xml,而是存储在架子上的计算结果。

答案 1 :(得分:0)

看到你的例子,我首先想到的是cache.has_key()有副作用,即这个调用会为缓存添加密钥。你得到什么

print cache.has_key('xxx')
print list(cache.keys())