【发布时间】:2011-12-26 07:32:55
【问题描述】:
_radixSort_0 = [0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,
0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0];
/*
RADIX SORT
Use 256 bins
Use shadow array
- Get counts
- Transform counts to pointers
- Sort from LSB - MSB
*/
function radixSort(intArr) {
var cpy = new Int32Array(intArr.length);
var c4 = [].concat(_radixSort_0);
var c3 = [].concat(_radixSort_0);
var c2 = [].concat(_radixSort_0);
var c1 = [].concat(_radixSort_0);
var o4 = 0; var t4;
var o3 = 0; var t3;
var o2 = 0; var t2;
var o1 = 0; var t1;
var x;
for(x=0; x<intArr.length; x++) {
t4 = intArr[x] & 0xFF;
t3 = (intArr[x] >> 8) & 0xFF;
t2 = (intArr[x] >> 16) & 0xFF;
t1 = (intArr[x] >> 24) & 0xFF ^ 0x80;
c4[t4]++;
c3[t3]++;
c2[t2]++;
c1[t1]++;
}
for (x=0; x<256; x++) {
t4 = o4 + c4[x];
t3 = o3 + c3[x];
t2 = o2 + c2[x];
t1 = o1 + c1[x];
c4[x] = o4;
c3[x] = o3;
c2[x] = o2;
c1[x] = o1;
o4 = t4;
o3 = t3;
o2 = t2;
o1 = t1;
}
for(x=0; x<intArr.length; x++) {
t4 = intArr[x] & 0xFF;
cpy[c4[t4]] = intArr[x];
c4[t4]++;
}
for(x=0; x<intArr.length; x++) {
t3 = (cpy[x] >> 8) & 0xFF;
intArr[c3[t3]] = cpy[x];
c3[t3]++;
}
for(x=0; x<intArr.length; x++) {
t2 = (intArr[x] >> 16) & 0xFF;
cpy[c2[t2]] = intArr[x];
c2[t2]++;
}
for(x=0; x<intArr.length; x++) {
t1 = (cpy[x] >> 24) & 0xFF ^ 0x80;
intArr[c1[t1]] = cpy[x];
c1[t1]++;
}
return intArr;
}
编辑:
到目前为止,最好的/唯一的主要优化是 JS 类型数组。 对普通基数排序的影子数组使用类型化数组已经产生了最好的结果。我还能够使用内置堆栈推送/弹出的 JS 从就地快速排序中挤出一些额外的东西。
Intel i7 870, 4GB, FireFox 8.0
2mil
radixSort(intArr): 172 ms
radixSortIP(intArr): 1738 ms
quickSortIP(arr): 661 ms
200k
radixSort(intArr): 18 ms
radixSortIP(intArr): 26 ms
quickSortIP(arr): 58 ms
看来标准基数排序确实是这个工作流程的王道。如果有人有时间尝试循环展开或其他修改,我将不胜感激。
我有一个特定的用例,我希望在 JavaScript 中实现最快的排序实现。客户端脚本将访问大型(50,000 - 2 百万)、未排序(基本上是随机)、整数(32 位有符号)数组,然后需要对这些数据进行排序和呈现。
我已经实现了相当快的原地基数排序和原地快速排序jsfiddle benchmark,但对于我的上限数组长度,它们仍然相当慢。快速排序在我的上限数组大小上表现更好,而基数排序在我的下限上表现更好。
defaultSort is the built-in JavaScript array.sort with an integer compare function
Intel C2Q 9650, 4GB, FireFox 3.6
2mil
radixSortIP(intArr): 5554 ms
quickSortIP(arr): 1796 ms
200k
radixSortIP(intArr): 139 ms
quickSortIP(arr): 190 ms
defaultSort(intArr): 354 ms
Intel i7 870, 4GB, FireFox 8.0
2mil
radixSortIP(intArr): 990 ms
quickSortIP(arr): 882 ms
defaultSort(intArr): 3632 ms
200k
radixSortIP(intArr): 28 ms
quickSortIP(arr): 68 ms
defaultSort(intArr): 306 ms
问题
- 是否有更好的排序算法实现可以满足我的用例/需求?
- 是否可以对我的就地基数/快速排序实现进行任何优化以提高性能?
- 有没有一种有效的方法可以将我的就地基数排序从递归函数转换为迭代函数?内存和执行速度。
目标
- 我希望这些答案能帮助我在基准测试中获得约 20-30% 的性能提升。
澄清/说明
- “DEFINE FAST”我更喜欢它在所有现代浏览器上运行良好的一般情况,但如果有一个特定于浏览器的优化可以带来显着的改进,这可能是可以接受的。
- 排序可以在服务器端完成,但我宁愿避免这种情况,因为 JS 应用程序可能会成为独立应用程序(与一些现成的专有应用程序配对,将传感器数据流式传输到文件)。
- JavaScript 可能不是最好的语言,但它是必需的。
- 我已经问过这个问题https://stackoverflow.com/questions/7111525/fastest-way-to-sort-integer-arrays-in-javascript 一个不正确的答案被投票,问题被关闭了。
- 我尝试使用多个浏览器窗口实例作为临时多线程;它没有成功。我会对有关生成多个并发窗口的有用信息感兴趣。
【问题讨论】:
-
非常有趣的是基数排序比快速排序慢。您确定您正确实施了吗?创建数组花了多少时间?
-
您是否检查过使用浮点数填充数组时的性能提升?
test[x]=parseFloat(..rand..) -
在你的分区中使用三的中位数可能会给你的快速排序实现 10% 的加速,并且会避免快速排序在部分有序子集上的大部分问题。更好的是五位数的中位数,这样可以避免常见的三名杀手的中位数。
-
也许创建一个jsperf.com 页面来反映已尝试的解决方案?
-
只是我的 2 美分... 200k 个 4 字节的项目可能适合大多数现代处理器的片上 CPU 缓存,而 200 万可能不会。一旦我们不得不使用 DRAM,基数排序的随机访问特性将损害性能。快速排序通常需要顺序内存访问。
标签: javascript performance algorithm optimization sorting