【发布时间】:2013-12-18 15:43:50
【问题描述】:
我正在使用 node-phantom 将项目发布到网站上的购物车。问题是当我使用 page.open 导航到购物车页面时(在已经将商品添加到购物车之后),我收到一个 html 响应,说我需要在浏览器中启用 javascript 才能查看购物购物车页面。我检查了 settings.javascriptEnabled 设置,发现它设置为“true”。此时我一头雾水,为什么页面会认为phantomjs没有启用javascript?
这是我的代码:
var phantom = require('node-phantom');
phantom.create(function (err, ph) {
ph.createPage(function (err, page) {
page.get('settings', function(err, oldSettings) {
console.log('\r\n oldSettings: ' + JSON.stringify(oldSettings));
page.open('http://www.somesite.com/shoppingcart/default.cfm', function (err, status) {
page.injectJs(jqueryPath, function (err) {
setTimeout(function() {
page.evaluate(function (injectedSku) {
var localErr;
var skuInCart;
var checkoutLnkMsg;
var pageHTML;
try {
pageHTML = $("html").html();
// Get 'SKUs' input element.
skuInCart = $('input[name="SKUs"]').val();
if (injectedSku === skuInCart) {
var checkoutLnk = $('#cartAction_bottom a[alt="Checkout"');
checkoutLnk.on("click", function() {
checkoutLnkMsg = '"' + checkoutLnk.href + '" link has been clicked';
});
checkoutLnk.click();
} else {
throw new Error('Product not in cart');
}
} catch (e) {
localErr = e;
}
return {
pageHTML: pageHTML,
err: localErr,
skuInCart: skuInCart,
checkoutLnkMsg: checkoutLnkMsg,
injectedSku: injectedSku
};
}, function (err, result) {
if (result.err) {
callback(err);
//return ph.exit();
}
fs.writeFileSync("./html_log.txt", result.pageHTML);
console.log('\r\n checkout - page.evaluate - injectedSku: ' + result.injectedSku);
console.log('\r\n checkout - page.evaluate - result.skuInCart: ' + JSON.stringify(result.skuInCart));
console.log('\r\n checkout - page.evaluate - result.checkoutLnkMsg: ' + result.checkoutLnkMsg);
callback(null);
//return ph.exit();
}, sku);
}, 1250);
});
});
});
});
});
【问题讨论】:
-
你能粘贴你得到的确切错误吗?
-
这并不是真正的错误。它只是来自网站的一个 html 响应,带有一条消息,例如“请在浏览器中启用 javascript 以便正确查看此页面。”
-
嗯,你试过我下面建议的解决方案了吗?
-
是的,请在答案旁边查看我的评论。
标签: javascript node.js web-scraping phantomjs