【发布时间】:2010-12-20 02:15:04
【问题描述】:
我需要解析大量使用 HTML 字体标签进行格式化的文本,
例如:
<font face="fontname" ...>Some text</font>
具体来说,我需要确定将使用文本中使用的每种字体呈现哪些字符。我需要能够处理另一个字体标签中的字体标签之类的东西。
我需要为此使用 C#。是否有某种 C# 解析器类可以使这更容易?还是我自己写?
谢谢!
【问题讨论】:
我需要解析大量使用 HTML 字体标签进行格式化的文本,
例如:
<font face="fontname" ...>Some text</font>
具体来说,我需要确定将使用文本中使用的每种字体呈现哪些字符。我需要能够处理另一个字体标签中的字体标签之类的东西。
我需要为此使用 C#。是否有某种 C# 解析器类可以使这更容易?还是我自己写?
谢谢!
【问题讨论】:
我没用过,但是看到HTML Agility Pack经常提到这类东西。
【讨论】:
不确定这是否适用于您的情况,因为我不知道预期用途是什么,但是 XSLT 模板的使用呢?
【讨论】:
您可以将 HTML 加载到 Internet Explorer 中,然后在 DOM 中查询字体标签(或 CSS 样式)。
不知道这是否是性能方面的最佳选择。
【讨论】: