【发布时间】:2019-09-24 07:10:57
【问题描述】:
我想将 HTML 网站转换为 Javascript 对象,例如,如果用户在文本框“http://Host/page”中给出了 url,则需要抓取网站并将其转换为 javascript 对象,如下所示,
{
"rootId": 1,
"children": [
{
"nodeType": 10,
"id": 2,
"name": "html",
"publicId": "",
"systemId": ""
},
{
"nodeType": 1,
"id": 3,
"tagName": "HTML",
"attributes": {
"lang": "en"
},
"childNodes": [
{
"nodeType": 1,
"id": 4,
"tagName": "HEAD",
"attributes": {},
"childNodes": [
{
"nodeType": 3,
"id": 5,
"textContent": "\n"
},
{
"nodeType": 1,
"id": 6,
"tagName": "TITLE",
"attributes": {},
"childNodes": [
{
"nodeType": 3,
"id": 7,
"textContent": "About"
}
]
},......
感谢任何帮助
【问题讨论】:
-
为什么,该格式没有规范 - 例如 nodeType numbers ?您直接在DOM中有类似的属性,所以不明白这个翻译的目的。或者如果您有文字,developer.mozilla.org/en-US/docs/Web/API/DOMParser 会不会帮忙?
-
你试过什么?你的代码在哪里失败了?还是您希望其他人为您编写所有内容?
-
Map HTML to JSON的可能重复