【发布时间】:2013-01-31 14:21:47
【问题描述】:
我有一个如下所示的 HTML 文件:
<html>
<head>
<title>foobar</title>
</head>
<body>
bla bla<br />
{[CONTAINER]}
Hello
{[/CONTAINER]}
</body>
</html>
如何从 html 文件的其余部分中获取容器中的“Hello”?几年前我在 PHP 中做过这个,我记得一个 REGEX 函数,它调用一个定义类函数并将容器的内容作为参数提供。
谁能告诉我如何在 Java 中做到这一点?
【问题讨论】:
-
@user2029057:您能说明我们可以对您的文本做出什么假设吗?
-
HTML 在尝试使用 RegEx 时会遇到很多问题。规范的帖子是 [一个众所周知的 StackOverflow 帖子] (stackoverflow.com/questions/1732348/…),例如处理标签属性。 @Nikita 的回答很好地涵盖了它。 OP 可以免费使用正则表达式,但要小心许多边缘情况。