【发布时间】:2021-11-30 01:37:37
【问题描述】:
我想按分区迭代数据帧,并为每个分区迭代其所有行并创建它们的 deleteList,其中将包含 HBase 的每行删除对象。 我在 Java 中使用 Spark 和 HBase,并使用以下代码创建了一个 Row 对象:
df.foreachPartition((ForeachPartitionFunction<Row> iterator -> {
while (iterator.hasNext()) {
Row row = RowFactory.create(iterator.next());
deleteList.add(new Delete(Bytes.toBytes(String.valueOf(row))));
}
}
但它不起作用,因为我无法正确访问行的值。而 df 有一列名为“hbase_key”。
【问题讨论】:
-
请显示更多您的代码。
iterator是什么? hbase 表使用什么键? -
是的。看看我编辑了什么
标签: java apache-spark hbase