在多线程中写入文件

时间:2012-09-14 05:03:12

标签: python

前几天刚刚开始python,对整个多线程概念不熟悉。在多线程处理时写入文件时遇到问题。如果我以常规方式进行,它将不断覆盖正在编写的内容。

使用5个线程时写入文件的正确方法是什么?

2 个答案:

答案 0 :(得分:2)

不降低性能的最好方法是在所有线程之间使用一个队列,每个线程都会枚举一个项目,而一个主线程只是将一个项目deque并将其写入一个文件,该队列是线程安全的并且阻塞时它是空的,或者更好,如果可能的话,只需返回5个线程中的所有值,然后将其写入文件,IO往往是我们可以做的更昂贵的操作之一,所以最好限制它和我们一样多可以。

另请注意,如果要利用多个处理引擎,python中的线程不会利用多个核心,导致GIL使用multiprocessing

这是一个简单的例子:

from multiprocessing import Process, Queue

def test_1(q):
    for i in range(10):
        q.put('test_1: ' + str(i))

def test_2(q):
    for i in range(10):
        q.put('test_2: ' + str(i))

q = Queue()
p1 = Process(target=test_1, args=(q,))
p2 = Process(target=test_2, args=(q,))
p1.start()
p2.start()

with open('test.txt', 'w') as file:
    while p1.is_alive() or p2.is_alive() or not q.empty():
        try:
            value = q.get(timeout = 1)
            file.write(value + '\n')
        except Exception as qe:
            print "Empty Queue or dead process"
p1.join()
p2.join()

以及test.txt的内容:

test_1: 0
test_1: 1
test_1: 2
test_1: 3
test_1: 4
test_2: 0
test_1: 5
test_2: 1
test_1: 6
test_2: 2
test_1: 7
test_2: 3
test_1: 8
test_2: 4
test_1: 9
test_2: 5
test_2: 6
test_2: 7
test_2: 8
test_2: 9

答案 1 :(得分:1)

一种方法是锁定文件,这样一次只有一个线程可以访问它;检查threading.Lock