【发布时间】:2015-03-04 10:20:51
【问题描述】:
我有一个包含不同类型 html 标签的字符串。
我想删除所有<a> 和</a> 标签。
我试过了:
string.replaceAll("<a>", "");
string.replaceAll("</a>", "");
但它不起作用。这些标签仍保留在字符串中。为什么?
【问题讨论】:
-
字符串是不可变的;每个修改字符串的操作都会返回一个字符串。
-
不要在 HTML / XML 上使用正则表达式。还向我们展示示例输入
-
更好的是解析html而不是使用正则表达式删除标签。
-
实际上对于替换,我会在这里使用正则表达式.. 并非地球上 HTML 文件中的每个操作都应该使用解析器。
-
当您输入您的问题(以及您之前的 31 个问题)时,右侧有一个橙色的大如何格式化框。值得一读。还有一个完整的格式化辅助工具栏。还有一个包含大量有用信息的 [?] 按钮。以及文本框下方的预览区域。当你写下你的五个答案时,这些东西大部分都在那里。请花时间学习使用它们。
标签: java html parsing tags replaceall