【发布时间】:2012-12-07 15:02:28
【问题描述】:
这是代码的有用部分:
java.util.List<Element> elems = src.getAllElements();
Iterator it = elems.iterator();
Element el;
String key,value,date="",place="";
String [] data;
int k=0;
Segment content;
String contentstr;
String classname;
while(it.hasNext()){
el = (Element)it.next();
if(el.getName().equals("span"))
{
classname=el.getAttributeValue("class");
if(classname.equals("edit_body"))
{
//java.util.List<Element> elemsinner = el.getChildElements();
//Iterator itinner = elemsinner.iterator();
content=el.getContent();
contentstr=content.toString();
if(true)
{
System.out.println("Done!");
System.out.println(classname);
System.out.println(contentstr);
}
}
}
}
没有输出。但是,如果我删除 if(classname.equals("edit_body")) 条件,它会打印(在其中一次迭代中):
Done!
edit_body
"I honestly think it is better to be a failure at something you love than to be a success at something you hate."
无法获取错误部分...求助!
我正在使用外部 java 库 BTW 进行 html 解析。
顺便说一句,输出开始时有两个错误,无论是否有 if 条件,这两种情况都存在。:
Dec 20, 2012 11:53:11 AM net.htmlparser.jericho.LoggerProviderJava$JavaLogger error SEVERE: EndTag br at (r1992,c60,p94048) not recognised as type '/normal' because its name and closing delimiter are separated by characters other than white space
Dec 20, 2012 11:53:11 AM net.htmlparser.jericho.LoggerProviderJava$JavaLogger error SEVERE: Encountered possible EndTag at (r1992,c60,p94048) whose content does not match a registered EndTagType
希望不会导致错误
好的,请有人给我解释一下! "edit_body".equals(el.getAttributeValue("class")) 工作!!
【问题讨论】:
-
做一个
System.out.println(el.getName()) -
它应该是跨度
-
在我们开始帮助之前,您的代码缺少关键部分。Does src.getAllElements();实际输出什么? Element#getName 的 API 是什么?假设 string 上的 equals 确实是错误的,你真的认为如果 String 上的 equals 方法不起作用,java 仍然存在。一般来说,当有人认为 java API 被破坏时,99.999% 的时间不是 java,而是他们自己的代码。
-
好吧,当然
src.getAllElements会给出输出,因为如果我删除给定的if条件,迭代器会完美工作.. getName() 为您提供字符串中标签的名称...jericho.htmlparser.net/docs/javadoc/index.html很明显,我不认为 equals 方法有问题或 JAVA API 已损坏,否则我不会寻求您的帮助。问题的标题是我能给出的最接近的短语! -
我从来没有遇到过这个问题,但尝试将两个字符串转换为相同的字符集? docs.oracle.com/javase/6/docs/api/java/lang/… 然后比较字节数组。
标签: java html string parsing compare