【发布时间】:2011-07-19 17:11:41
【问题描述】:
我想清理一个 HTML 文档(在 google 文档中创建),以便我可以在我的 CMS 上发布它。
我有一个字符串中的源文档,从 to ,带有标题、样式、正文等。我想提取正文内容并替换/消除一些标签。如果我可以使用 jQuery 来做到这一点,我认为它会比使用更复杂的 html 解析器更容易。
但是当我尝试获取文档的正文时,我没有得到可用的结果。我试过了:
var gdoc = "<html>...google document...</html>"
$(gdoc) //list of text nodes, can not rebuild to document or find body
$("body",gdoc) //empty list
这是可行的还是我完全错了? 您可以分享任何提示/参考资料吗?
【问题讨论】:
-
由于安全原因,您无法从其他域访问文档
-
您可以尝试在例如(隐藏的)iframe 中加载 HTML 字符串,然后使用 jQuery 访问它的 DOM
-
我有一个字符串上的文档,问题似乎是获取整个正文内容(不仅仅是特定元素)。
标签: javascript jquery html dom sanitization