【发布时间】:2012-04-10 12:38:50
【问题描述】:
我有一个像这样的未格式化的 XML 文件:
<ROOT>
<A0>Hi</A0>
<A1 A="hi" A="how" A="are" A="You?"></A1>
<A2 A2="Bye"> </A2>
<A3>In this tag have hexadecimal value</A3>
</ROOT>
问题:
- 如何处理标签
<A1>中的重复属性名称? - 如何处理标记
<A3>中的十六进制值?
我必须使用这种类型的文件作为 SSIS 包中的源。
谢谢
【问题讨论】:
-
1.格式良好的 XML 文档不能具有相同名称的属性。 2. 不清楚
"How handle Hexadecimal values "是什么意思,您还没有确切说明您希望以何种方式处理这些内容。请编辑问题并使其更有意义。 -
如果这是您的要求,那么您的文件不是 XML 文件;)。如果您尝试使用一些现有的解析器,您可能会遇到很多麻烦,而那些可以工作的解析器可能会例如。停在下一个(或上一个)版本。我想我会尝试一些面向 HTML 的解析器,因为那里有一些疯狂的网站,所以他们可能不会对您的文档内容如此挑剔。