Java：如何在递归文件夹大小查找算法中实现多线程？答案

【问题标题】：Java : How to implement Multi-Threading into a recursive folder size finder algorithm?Java：如何在递归文件夹大小查找算法中实现多线程？
【发布时间】：2018-06-11 17:12:05
【问题描述】：

所以，我已经开发了文件夹大小查找器的单线程版本，但为了让它更有趣，我想提高它的速度，并希望加深我对多线程进程的理解。然而，在 ~ 30 次修订之后，似乎总是有问题，无论是：
- 主线程在所有线程完成之前打印结果
- long 类型在不应该有的时候溢出（可能是双重计数）
- 多线程版本比单线程版本花费更长的时间

我很茫然，我不知道这样的问题是不适合多线程还是我做错了。我把我最“成功”的修订放在下面。

我意识到它在技术上开始然后立即加入工作线程，使其几乎比单踩更糟糕。然而，这是我让主线程显示正确结果的唯一方法。

所以我的主要问题是让工作线程只在最后加入，使其并行探索所有子文件夹，然后加入主线程以显示正确的结果。

package sizeBrowserCode;

import java.io.File;
import java.io.FileWriter;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;


public class Main {
static long lengthy;
static Thread worker;
static long sum;

private static long getLength() {
    return Main.lengthy;
}

private static void setLength(long var) {
    Main.lengthy=var;
}

private static long getFolderSize(File folder) {
    long length=0;
    File[] files = folder.listFiles();

    int count = files.length;

    for (int i = 0; i < count; i++) {
        if (files[i].isFile()) {
            length += files[i].length();
        }
        else {
            length += getFolderSize(files[i],true);
        }
    }
    System.out.println(folder+" // "+length);

    return length;
}

private static long getFolderSize(File folder,boolean multiThreaded) {
    if(multiThreaded) {
        long length;
        worker=new Thread(new Runnable() {
             public void run() {

                setLength(getFolderSize(folder));
                 }
                });
            worker.start();
            try {
                worker.join();
            } catch (InterruptedException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
            length=getLength();
        return length;

    }else {
        return getFolderSize(folder);
    }
}


public static String convert_Bytes(long bytes,String prefered_Unit) {
    prefered_Unit=prefered_Unit.toLowerCase().trim();
    switch (prefered_Unit) {
    case "b": return (bytes+" Bytes");
    case "kb": return (bytes/1024+" Kilobytes");
    case "mb": return (bytes/Math.pow(1024,2)+" Megabytes");
    case "gb": return (bytes/Math.pow(1024,3)+" Gigabytes");
    case "tb": return (bytes/Math.pow(1024,4)+" Terabytes");
    default:System.out.println("Incorrect notation; Please use\nb\nkb\nmb\ngb\ntb");
            System.exit(0);
            return null;

    }
}

public static String convert_Bytes(long bytes) {
    double Kb=0;
    double Mb=0;
    double Gb=0;
    double Tb=0;
    String result;
    if (bytes>=1024) {
        Kb=bytes/1024;
        bytes=0;
        result=" Kilobytes";
        if(Kb>=1024) {
            Mb=Kb/1024;
            Kb=0;
            result=" Megabytes";
            if(Mb>=1024) {
                Gb=Mb/1024;
                Mb=0;
                result=" Gigabytes";
                if(Gb>=1024) {
                    Tb=Gb/1024;
                    Gb=0;
                    result=" Terabyte";
                }
            }
        }
    }else {
        result=" Bytes";
    }
    double sum=bytes+Mb+Gb+Tb;
    return (sum+result);
}

public static void main(String[] args) {

    String chosen_Folder =args[0];
    String prefered_Unit;
    String full_Size;
    try {
        prefered_Unit =args[1];
    }catch (Exception e) {
        prefered_Unit=null;
    }

    String local_Folder=System.getProperty("user.dir");
    File full_Path;
    String backslash   ="\\";
    String forwardslash="/";
    String seperater;
    if(System.getProperty("os.name").toLowerCase().indexOf("win")>=0) {
        seperater=backslash;
    }else {
        seperater=forwardslash;
    }
    full_Path=new File(local_Folder+seperater+chosen_Folder);



    System.out.println(full_Path);
    long startTime =System.nanoTime();
    if(prefered_Unit!=null) {
        full_Size=convert_Bytes(getFolderSize(full_Path),prefered_Unit);

    }else {
        full_Size=convert_Bytes(getFolderSize(full_Path));
    }
    long endTime =System.nanoTime();

    System.out.println("The size of "+chosen_Folder+" is: "+full_Size);
    System.out.println("Took "+TimeUnit.NANOSECONDS.toSeconds(endTime-startTime)+" seconds to execute.");
    File size_Indicator = new File(full_Path+seperater+"FileSize.txt");
    try {
    size_Indicator.createNewFile();
    FileWriter writer = new FileWriter(size_Indicator);
    writer.write(full_Size);
    writer.close();
    }catch(Exception e) {
        System.err.println(e);
    }

}

}

【问题讨论】：

当您告诉硬盘驱动器读取/写入文件或目录时，它会向机器发送信号以将读写头定位在距磁盘中心适当距离的位置，然后等待让磁盘旋转到正确的操作位置，然后执行操作。如果您正在读取文件，则会对事物进行优化，从而无需为下一次读取重新定位它。但是如果另一个线程将磁头发送到磁盘的不同部分，那么这会减慢第一次操作，因为需要再次定位磁头。从 HDD 获取此信息不受 CPU 限制。
@arcy 的观点解释了为什么它运行得更慢。不过，您可能在这里线程过多，因为您正在为每个目录创建一个线程。工作线程池通常工作得更好，特别是对于线程数可能变得非常高的问题。无论如何，这仍然是回答您其他问题（加入、溢出）的好例子。

标签： java multithreading parallel-processing

【解决方案1】：

只是为了补充其他答案。

尽量避免使用

worker = new Thread(new Runnable() {
    ...
  }

改用执行器。它们更易于使用、安排、运行和获取结果。此外，他们还负责处理线程池和其他开销。

阅读this。

执行器从 Java 5 开始可用，它们是任何 JVM 的组成部分。

【讨论】：