【问题标题】:Excel to XML for data stripping用于数据剥离的 Excel 到 XML
【发布时间】:2010-10-15 18:49:01
【问题描述】:

我正在尝试从数千个相同的 Excel 2007/2010 文件中删除数据。我更喜欢使用抓取技术来做到这一点。是否可以抓取 Excel 文件,因为据我所知,该文件基本上是某种 XML 格式。

那么,是否可以将 Excel 文件转换为 XML 或其他一些标记格式?

【问题讨论】:

  • 您使用的是什么环境和编程语言?
  • 过去,我使用 HTML Agility Pack 和 C#(在 SSIS 脚本中)来抓取 XML 数据;所以我希望将 Excel 文件转换为 XML 并从各种标签中抓取数据。
  • 那么使用 Excel 和 VBA 是不可能的吗?这是一种原生的做事方式。
  • 我更喜欢坚持使用 SSIS 将这些数据加载到数据库中。而且我不是 VBA 粉丝。

标签: xml excel scrape


【解决方案1】:

XLSX 格式实际上是一个 ZIP 文件,但具有不同的扩展名。如果您使用您喜欢的 zip 程序解压缩它,您会发现工作表数据位于 xl\worksheets 中。每个工作表都保存为单独的 XML 文档。您应该能够按照 Michael 的建议使用 XSLT 来提取您需要的数据。

【讨论】:

    【解决方案2】:

    默认情况下,Excel 2010 文件采用 XML 格式。那么您的 Excel 文件当前采用什么文件格式(即它们有什么扩展名)?你的问题在这个问题上有些模棱两可。如果它们已经在 XML 中,您可以使用 XSLT 来抓取它们。

    【讨论】:

    • 他们在 XLSX;所以我只是询问如何将它们从常见的工作表格式转换为 XML 标记。几年前,我记得单击 Excel 中的一个按钮,使我能够看到标记而不是常规界面。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-05-27
    • 1970-01-01
    相关资源
    最近更新 更多