【问题标题】:How to add attribute and value to xml tag in scala(spark) by using databrick如何使用databrick向scala(spark)中的xml标签添加属性和值
【发布时间】:2019-10-22 17:09:27
【问题描述】:

我需要使用数据块在 spark scala 的 display-name 标记中添加“xml:lang”作为属性和“shirt”作为值。请帮忙。 例如 - <display-name xml:lang="x-default">Shirt</display-name>

【问题讨论】:

标签: scala apache-spark databricks


【解决方案1】:

一种方法是使用databricks spark-xml 库,如下所示:

  1. 将 spark-xml 库导入您的工作区 或
  2. 将库附加到您的集群

  1. 在笔记本中使用以下代码读取 xml 文件,其中“note”是我的 xml 文件的根目录。

xmldata = spark.read.format('xml').option("rootTag","note").load('dbfs:/mnt/mydatafolder/xmls/note.xml') 显示(xml数据)

例子:

更多详情请参考“XML Data Sources for Apache Spark”。

希望这会有所帮助。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2013-07-29
    • 1970-01-01
    • 1970-01-01
    • 2014-11-04
    相关资源
    最近更新 更多