【发布时间】:2012-03-29 20:31:46
【问题描述】:
我正在尝试从以下 html 中解析标题:
"Website (Newton) at datanucleus.org">Website</a></div>
我正在使用indexOf:strLine.indexOf("\">Website")
我想知道如何搜索链接之前出现的第一个空格。所以我想捕获“”和“>Website
即datanucleus.org
有什么想法吗?谢谢!
【问题讨论】:
-
根据您所处情况的复杂程度,您可能需要考虑使用适当的 HTML 解析器。无论如何,更好地学习字符串函数。这是一个相对简单的事情。只需计算要传递子字符串的索引。
-
强烈同意@Corbin 关于使用 HTML 解析器的观点,但如果你要坚持基础,你应该开始考虑使用正则表达式。
-
罗杰,我会调查的。不确定这是简单的还是那些棘手的事情之一。
-
请注意,如果您尝试进行字符串匹配而不使用真正的解析器进行完整解析,您有时会出错 - 例如,您可能会匹配已被注释掉的内容,或者如果属性在单引号而不是双引号中,则无法匹配内容。