【发布时间】:2009-12-27 06:46:58
【问题描述】:
可能重复:
Which CPAN module would you recommend for turning HTML into plain text?
问题:
- 是否有一个模块可以渲染 HTML,专门用于收集文本,同时遵守 字体样式标签,例如
<tt>、<b>、@ 987654326@ 等和 break-line<br>,类似于 Lynx。
例如:
# cat test.html
<body>
<div id="foo" class="blah">
<tt>test<br>
<b>test</b><br>
whatever<br>
test</tt>
</div>
</body>
# lynx.exe --dump test.html
test
test
whatever
test
注意:第二行应该是粗体。
【问题讨论】: