【发布时间】:2018-05-19 20:43:13
【问题描述】:
我正在尝试使用 spark-xml jar 在 pyspark 中读取 xml/嵌套 xml。
df = sqlContext.read \
.format("com.databricks.spark.xml")\
.option("rowTag", "hierachy")\
.load("test.xml"
当我执行时,数据框没有正确创建。
+--------------------+
| att|
+--------------------+
|[[1,Data,[Wrapped...|
+--------------------+
下面提到了我的xml格式:
【问题讨论】:
标签: xml apache-spark dataframe pyspark apache-spark-xml