【发布时间】:2015-08-30 06:51:32
【问题描述】:
我想在 HTML 源上使用 BaseX 运行一些 XQuery 命令,这些命令可能充满了必须删除的<script>、<style> 节点以及必须具有的未闭合标签(<br>、<img>)一双。 (例如this page的脏源)
"Converting HTML to XML" 建议使用 Tidy,但它没有 GUI,而且在我的源代码上似乎无法正常工作(它什么也不输出),我怀疑它是否会删除脚本和其他不必要的标签。顺便说一句,它很旧了。
由于我没有找到任何满足我需求的问题,所以我再次询问。因为和编码和查询的工具非常接近,所以在这里问。
【问题讨论】:
-
接近投票者:我看不到这个问题如何搜索产品推荐,也不需要任何代码来重现问题。
标签: html xml converter xquery basex