【问题标题】:Writing to file in multi-threading多线程写入文件
【发布时间】:2012-09-14 05:03:11
【问题描述】:

前几天刚开始使用python,对多线程的整个概念是新的。我在多线程时无法写入文件。如果我按照常规方式进行操作,它会不断覆盖正在写入的内容。

在使用 5 个线程时写入文件的正确方法是什么?

【问题讨论】:

    标签: python


    【解决方案1】:

    不降低性能的最好方法是在所有线程之间使用队列,每个线程将一个项目入队,而主线程将简单地将一个项目出队并将其写入文件,队列是线程安全的并且在以下情况下阻塞它是空的,或者如果可能的话更好,只需从 5 个线程返回所有值,然后将其写入文件,IO 往往是我们可以做的更昂贵的操作之一,所以最好尽可能地限制它可以。

    另请注意,python 中的线程不利用多核,因为如果您想利用多个处理引擎,GIL 而不是使用multiprocessing

    这是一个简单的例子:

    from multiprocessing import Process, Queue
    
    def test_1(q):
        for i in range(10):
            q.put('test_1: ' + str(i))
    
    def test_2(q):
        for i in range(10):
            q.put('test_2: ' + str(i))
    
    q = Queue()
    p1 = Process(target=test_1, args=(q,))
    p2 = Process(target=test_2, args=(q,))
    p1.start()
    p2.start()
    
    with open('test.txt', 'w') as file:
        while p1.is_alive() or p2.is_alive() or not q.empty():
            try:
                value = q.get(timeout = 1)
                file.write(value + '\n')
            except Exception as qe:
                print "Empty Queue or dead process"
    p1.join()
    p2.join()
    

    以及test.txt的内容:

    test_1: 0
    test_1: 1
    test_1: 2
    test_1: 3
    test_1: 4
    test_2: 0
    test_1: 5
    test_2: 1
    test_1: 6
    test_2: 2
    test_1: 7
    test_2: 3
    test_1: 8
    test_2: 4
    test_1: 9
    test_2: 5
    test_2: 6
    test_2: 7
    test_2: 8
    test_2: 9
    

    【讨论】:

    • 谢谢!很详细的回答,我现在试试看
    【解决方案2】:

    一种方法是锁定文件,这样一次只有一个线程可以访问它;检查threading.Lock

    【讨论】:

    • 如果另一个线程在文件被锁定时需要写入文件怎么办?
    • @nick:它会等到锁被释放。
    • 整个线程会一直等到它可以写,还是会继续做它应该做的事情?
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-12-31
    • 2015-11-26
    • 2023-02-01
    • 1970-01-01
    相关资源
    最近更新 更多