楔子

spark java版本的二次排序

实现

数据如下

2::4
2::10
3::6
1::5

按照 第一列 和第二列 倒叙排列 实现如下的结果

3::6
2::10
2::4
1::5

demo

GitHub 位置SecondarySortKey.javaSecondarySort.java

Spark中sortByKey实现算子对数据的Key排序。二次排序需要自定义key值,在自定义key中实现排序的功能

排序使用了 Comparator进行排序 借助了工具类CompareToBuilder()的方法,排序部分如下

@Override
public int compareTo(SecondarySortKey o) {
	// 此结果是正序排列
	return new CompareToBuilder().append(first, o.first).append(second, o.second).toComparison();
	// 1::5
	// 2::4
	// 2::10
	// 3::6
}

Spark 二次排序自定义key 实现(Java)

相关文章:

  • 2021-11-05
  • 2021-09-11
  • 2022-01-21
  • 2022-12-23
  • 2021-11-28
  • 2021-11-14
  • 2021-10-18
  • 2021-10-14
猜你喜欢
  • 2022-12-23
  • 2021-12-27
  • 2022-02-23
  • 2022-12-23
  • 2021-08-22
  • 2021-11-23
  • 2022-02-10
相关资源
相似解决方案