【问题标题】:Parsing HTML with Spray使用 Spray 解析 HTML
【发布时间】:2016-04-21 02:17:52
【问题描述】:

在解析包含 &nbsp 实体的有效 HTML 时出现异常 The entity “nbsp” was referenced, but not declared(这使得它无效 XML;我不控制服务器)而使用spray.httpx.unmarshalling.BasicUnmarshallers.NodeSeqUnmarshallerHttpEntity 解组为NodeSeq

我可能可以预处理 HTML 以删除 &nbsp,但是使用 Spray 解析 HTML(使用 &nbsp)的公认方法是什么?

【问题讨论】:

    标签: scala spray spray-client


    【解决方案1】:

    您可能会尝试编写一个包含JSoupCustom Unmarshaller

    【讨论】:

      猜你喜欢
      • 2015-04-16
      • 2013-12-29
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2014-10-11
      • 2011-11-15
      • 2011-04-03
      相关资源
      最近更新 更多