【发布时间】:2010-10-25 11:48:38
【问题描述】:
我有一组需要解析的 html 文档。它们以 Latin1Encoded 编码。我正在使用 HtmlAgiliy 包进行“解析”。
我有一个 Xpath 查询(带有瑞典字符),由于文档和编码 VS 将 XPath 查询存储在其中的不同编码,我无法开始工作??
Xpath 查询:
doc.DocumentNode.SelectNodes(@"//h2[text()='Företag']/../div//span[text()='Resultat:']/../div");
xpath 查询在 Firefox 扩展 xpath 检查器中运行良好。
【问题讨论】:
-
你要解析的数据长什么样子?
-
我遇到了一个“神奇”的案例,它突然开始起作用了,这既好又烦人....我在某个地方读到 VS 在需要时首先开始以 UTF8 存储?
-
VS 存储源文件的格式无关紧要,因为 C# 中的字符串在运行时始终采用 Unicode (yoda.arachsys.com/csharp/strings.html)。如果您的输入 XML 文档已正确加载,则 XPath 表达式和 XML 在内部都采用 Unicode 编码。
标签: c# xpath latin1 file-encodings