【发布时间】:2012-10-04 17:59:33
【问题描述】:
我有一个html网页网址http://teluguone.com/recipes/content/Andhra-Spicy-Mutton-Curry-Recipe-6-221.html
我需要从上面的 url 中提取描述文本。
我的要求是,我需要在多个DIV标签之间获取带有html标签的文本,
例子:
<div class="relatedarticals_info_bold"><h1>Recipe Name</h1></div> : Andhra Spicy Mutton Curry Recipe</div>
</div> <div id="relatedarticals_info2"> <div class="relatedarticals_info"> <div class="relatedarticals_info_bold">
<h1>Author</h1></div> : Teluguone</div> </div> <div id="relatedarticals_info2"> <div class="relatedarticals_info">
<div class="relatedarticals_info_bold"><h1>Preparation Time</h1></div> : 30 Mins</div> </div>etc.....?
我需要得到这样的输出:
Recipe Name: Andhra Spicy Mutton Curry Recipe Author: Teluguone
Preparation Time: 30 Mins etc...
【问题讨论】:
-
您可能需要一个用于 Java ME 的 html 解析器。查看其他问题stackoverflow.com/questions/9715597/handle-text-html-in-j2me 中列出的选项
-
最初,我不需要纯文本,我需要在 div 标签之间带有一些标签的整个文本,在我用一些标签提取整个文本之后,我有一个代码可以从字符串中删除标签和输出纯文本
-
最初,我需要一个代码来提取多个div标签之间带有一些标签的文本?
-
对不起,我不明白你需要什么。 :(
-
etc.......?嗨 Telmo Pimentel Mota,我的实际要求是,我需要在多个 DIV 标签之间获取带有 html 标签的文本,例如: : 安得拉辣羊肉咖喱食谱