【发布时间】:2017-06-16 17:34:36
【问题描述】:
有两个表;一个是ID表1,另一个是属性表2。
表 1
表 2
如果表 1 中同一行的 ID 具有相同的属性,则我们得到数字 1,否则我们得到 0。最后,我们得到结果表 3。
表 3
例如id1和id2有不同的颜色和大小,所以id1和id2行(表3中的第2行)有“id1 id2 0 0”;
id1和id3颜色相同,大小不同,所以id1和id3行(表3第3行)有“id1 id3 1 0”;
相同的属性---1 不同的属性---0
如何使用 Scala 数据框获得结果表 3?
【问题讨论】:
-
请更清楚地更新问题。例如颜色列如何从蓝色变为 0 或 1,以及列大小中的 m 如何变为 0 或 1?
-
@RameshMaharjan 我已经详细描述了,你知道怎么做吗?
-
您的文件中是否有 table1 和 tabel2 的数据?或者它只是问题中的那么多数据?并感谢您的更新。现在很清楚
-
是的,我的文件与问题中的图片相同。在我的文件中,id1 id2 id3 都是像 id1:12404, id2:3408 这样的数字。你需要这些文件吗?
-
它们是 csv 格式的吗?
标签: scala apache-spark spark-dataframe