【发布时间】:2012-06-07 14:38:02
【问题描述】:
我想提取一些包含在 HTML 标签中的文本。例如:
<html><body>this is a warning message. wrongs values</body></html>
结果应该通过忽略所有 HTML 标记来获取消息。
有人有什么建议吗?
【问题讨论】:
-
@Iola:这个问题的措辞非常糟糕,以至于我什至无法猜测您的意思。请编辑它,也许提供一些示例输入和输出,向我们展示您目前编写的代码。
-
@Junuxx 他的意思是标记符号。 HTML balise = 法语的 HTML 标记 (fr.wikipedia.org/wiki/Langage_de_balisage)
-
顺便说一句:stackoverflow.com/questions/6582250/…的可能重复
-
您只需要处理这些吗?还是需要处理其他复杂的 html 结构?
-
找到了更接近的副本:regexp for html tags with Matlab
标签: html string parsing matlab