【发布时间】:2016-11-25 10:43:35
【问题描述】:
我是 spark 新手,我想将推荐产品ForUsers 的输出保存到 Hbase 表。我找到了一个示例 (https://sparkkb.wordpress.com/2015/05/04/save-javardd-to-hbase-using-saveasnewapihadoopdataset-spark-api-java-coding/) 显示使用 JavaPairRDD 和 saveAsNewAPIHadoopDataset 进行保存。
如何将JavaRDD<Tuple2<Object, Rating[]>> 转换为JavaPairRDD<ImmutableBytesWritable, Put> 以便使用saveAsNewAPIHadoopDataset?
//Loads the data from hdfs
MatrixFactorizationModel sameModel = MatrixFactorizationModel.load(jsc.sc(), trainedDataPath);
//Get recommendations for all users
JavaRDD<Tuple2<Object, Rating[]>> ratings3 = sameModel.recommendProductsForUsers(noOfProductsToReturn).toJavaRDD();
【问题讨论】:
-
您要保存模型或建议?
-
@eliasah 我想保存推荐
标签: apache-spark hbase matrix-factorization