【发布时间】:2018-06-11 17:12:05
【问题描述】:
所以,我已经开发了文件夹大小查找器的单线程版本,但为了让它更有趣,我想提高它的速度,并希望加深我对多线程进程的理解。然而,在 ~ 30 次修订之后,似乎总是有问题,无论是:
- 主线程在所有线程完成之前打印结果
- long 类型在不应该有的时候溢出(可能是双重计数)
- 多线程版本比单线程版本花费更长的时间
我很茫然,我不知道这样的问题是不适合多线程还是我做错了。我把我最“成功”的修订放在下面。
我意识到它在技术上开始然后立即加入工作线程,使其几乎比单踩更糟糕。然而,这是我让主线程显示正确结果的唯一方法。
所以我的主要问题是让工作线程只在最后加入,使其并行探索所有子文件夹,然后加入主线程以显示正确的结果。
package sizeBrowserCode;
import java.io.File;
import java.io.FileWriter;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
import java.util.concurrent.TimeUnit;
public class Main {
static long lengthy;
static Thread worker;
static long sum;
private static long getLength() {
return Main.lengthy;
}
private static void setLength(long var) {
Main.lengthy=var;
}
private static long getFolderSize(File folder) {
long length=0;
File[] files = folder.listFiles();
int count = files.length;
for (int i = 0; i < count; i++) {
if (files[i].isFile()) {
length += files[i].length();
}
else {
length += getFolderSize(files[i],true);
}
}
System.out.println(folder+" // "+length);
return length;
}
private static long getFolderSize(File folder,boolean multiThreaded) {
if(multiThreaded) {
long length;
worker=new Thread(new Runnable() {
public void run() {
setLength(getFolderSize(folder));
}
});
worker.start();
try {
worker.join();
} catch (InterruptedException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
length=getLength();
return length;
}else {
return getFolderSize(folder);
}
}
public static String convert_Bytes(long bytes,String prefered_Unit) {
prefered_Unit=prefered_Unit.toLowerCase().trim();
switch (prefered_Unit) {
case "b": return (bytes+" Bytes");
case "kb": return (bytes/1024+" Kilobytes");
case "mb": return (bytes/Math.pow(1024,2)+" Megabytes");
case "gb": return (bytes/Math.pow(1024,3)+" Gigabytes");
case "tb": return (bytes/Math.pow(1024,4)+" Terabytes");
default:System.out.println("Incorrect notation; Please use\nb\nkb\nmb\ngb\ntb");
System.exit(0);
return null;
}
}
public static String convert_Bytes(long bytes) {
double Kb=0;
double Mb=0;
double Gb=0;
double Tb=0;
String result;
if (bytes>=1024) {
Kb=bytes/1024;
bytes=0;
result=" Kilobytes";
if(Kb>=1024) {
Mb=Kb/1024;
Kb=0;
result=" Megabytes";
if(Mb>=1024) {
Gb=Mb/1024;
Mb=0;
result=" Gigabytes";
if(Gb>=1024) {
Tb=Gb/1024;
Gb=0;
result=" Terabyte";
}
}
}
}else {
result=" Bytes";
}
double sum=bytes+Mb+Gb+Tb;
return (sum+result);
}
public static void main(String[] args) {
String chosen_Folder =args[0];
String prefered_Unit;
String full_Size;
try {
prefered_Unit =args[1];
}catch (Exception e) {
prefered_Unit=null;
}
String local_Folder=System.getProperty("user.dir");
File full_Path;
String backslash ="\\";
String forwardslash="/";
String seperater;
if(System.getProperty("os.name").toLowerCase().indexOf("win")>=0) {
seperater=backslash;
}else {
seperater=forwardslash;
}
full_Path=new File(local_Folder+seperater+chosen_Folder);
System.out.println(full_Path);
long startTime =System.nanoTime();
if(prefered_Unit!=null) {
full_Size=convert_Bytes(getFolderSize(full_Path),prefered_Unit);
}else {
full_Size=convert_Bytes(getFolderSize(full_Path));
}
long endTime =System.nanoTime();
System.out.println("The size of "+chosen_Folder+" is: "+full_Size);
System.out.println("Took "+TimeUnit.NANOSECONDS.toSeconds(endTime-startTime)+" seconds to execute.");
File size_Indicator = new File(full_Path+seperater+"FileSize.txt");
try {
size_Indicator.createNewFile();
FileWriter writer = new FileWriter(size_Indicator);
writer.write(full_Size);
writer.close();
}catch(Exception e) {
System.err.println(e);
}
}
}
【问题讨论】:
-
当您告诉硬盘驱动器读取/写入文件或目录时,它会向机器发送信号以将读写头定位在距磁盘中心适当距离的位置,然后等待让磁盘旋转到正确的操作位置,然后执行操作。如果您正在读取文件,则会对事物进行优化,从而无需为下一次读取重新定位它。但是如果另一个线程将磁头发送到磁盘的不同部分,那么这会减慢第一次操作,因为需要再次定位磁头。从 HDD 获取此信息不受 CPU 限制。
-
@arcy 的观点解释了为什么它运行得更慢。不过,您可能在这里线程过多,因为您正在为每个目录创建一个线程。工作线程池通常工作得更好,特别是对于线程数可能变得非常高的问题。无论如何,这仍然是回答您其他问题(加入、溢出)的好例子。
标签: java multithreading parallel-processing