【问题标题】:How to add attribute and value to xml tag in scala(spark) by using databrick如何使用databrick向scala(spark)中的xml标签添加属性和值
【发布时间】:2019-10-22 17:09:27
【问题描述】:
我需要使用数据块在 spark scala 的 display-name 标记中添加“xml:lang”作为属性和“shirt”作为值。请帮忙。
例如 -
<display-name xml:lang="x-default">Shirt</display-name>
【问题讨论】:
标签:
scala
apache-spark
databricks
【解决方案1】:
一种方法是使用databricks spark-xml 库,如下所示:
- 将 spark-xml 库导入您的工作区
或
- 将库附加到您的集群
- 在笔记本中使用以下代码读取 xml 文件,其中“note”是我的 xml 文件的根目录。
xmldata = spark.read.format('xml').option("rootTag","note").load('dbfs:/mnt/mydatafolder/xmls/note.xml')
显示(xml数据)
例子:
更多详情请参考“XML Data Sources for Apache Spark”。
希望这会有所帮助。