前阵子踩过的一个坑,发朋友圈了,转过来记录一下。

是关于GraphX读取edgelist文件失败的问题,报invalid line错误。后来从《Spark GraphX图计算核心源码分析【图构建器、顶点、边】》查到,GraphX能识别的edgelist文件的格式,两列之间用一个或多个空格分隔,而不能是用逗号分隔的csv。如下图所示。973GB的文件再处理一遍我找谁说理去。。。。。

GraphX对edgelist文件格式的要求

相关文章:

  • 2022-12-23
  • 2022-12-23
  • 2021-12-16
  • 2022-12-23
  • 2021-11-03
  • 2021-12-20
  • 2022-12-23
  • 2021-12-04
猜你喜欢
  • 2021-07-22
  • 2022-12-23
  • 2021-12-13
  • 2021-03-30
  • 2021-06-16
  • 2022-02-24
  • 2021-06-20
相关资源
相似解决方案