【发布时间】:2018-09-20 13:30:30
【问题描述】:
试图找出一种将 json 文件加载到 databricks spark 中的方法,将 json 放入字典中,然后遍历它。
现在我正在尝试使用sc.textFile() 来加载文件。
我的 json 文件如下所示:
{
"tablename": "a",
"tablename": "b",
"tablename": "c",
...........
"tablename": "z",
}
我想遍历json文件
我尝试过的事情:
data = json.load(open('data.json'))
没用
with open('data.json') as data_file:
data = json.load(data_file)
没用
感谢您的帮助
【问题讨论】:
-
您是想将其读入 RDD 还是 spark DataFrame?
标签: python json apache-spark pyspark databricks