【问题标题】:DJ native swing jwebbrowser html parsing errorDJ原生swing jwebbrowser html解析错误
【发布时间】:2013-12-17 14:44:39
【问题描述】:

我有一个错误 htmlparsing 。 我认为问题源于引号 DjNative language=javascript error language="javascript" 我尝试了所有版本的 Dj 本机库

[致命错误] :2:18:与元素类型“语言”相关联的属性“{1}”需要打开引号。 org.xml.sax.SAXParseException;行号:2;列号:18;与元素类型“语言”关联的属性“{1}”应为开放式引用。 在 com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(未知来源) 在 com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(未知来源)

  private Document HTMLtoXML(String source)
 {
 Document doc = null;
     DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
     DocumentBuilder builder;
     try {
         builder = factory.newDocumentBuilder();
         InputSource src = new InputSource(new StringReader(source));
         doc = builder.parse(src);
     } catch (ParserConfigurationException e) {
         e.printStackTrace();
     } catch (SAXException e) {
        e.printStackTrace();
     } catch (IOException e) {
        e.printStackTrace();
     }
 return doc;  
 }

 public void StartTakip()
{   
  String htmlSource=webbrowser.getHTMLContent();
  dc = HTMLtoXML(htmlSource);   

 }

当我尝试通过 DJNative Swing 获取页面源代码时 html 页面

<HTML>
<HEAD>
<SCRIPT language=javascript src="/medula/scripts/capFirstLetters.js"></SCRIPT>
<TITLE>deneme</TITLE>
</HEAD>
<BODY bgcolor=#233333>
</BODY>
</HTML>

如果源代码如下所示,html 解析工作正常

<HTML>
<HEAD>
<SCRIPT language="javascript" src="/medula/scripts/capFirstLetters.js"></SCRIPT>
<TITLE>deneme</TITLE>
</HEAD>
<BODY bgcolor="#233333">
</BODY>
</HTML> 

【问题讨论】:

    标签: java html-parsing jwebbrowser djnativeswing


    【解决方案1】:

    我用 Jsoup-1.7.3.jar 解决了这个问题 例如:

      JWebBrowser jwebbrowser=new Jwebbrowser();
      Document doc=Jsoup.parse(jwebbrowser.getHTMLContent);
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-02-27
      • 2010-11-26
      • 1970-01-01
      • 2012-10-12
      相关资源
      最近更新 更多