【问题标题】:Puppeteer - How to browse google.com with proxies?Puppeteer - 如何使用代理浏览 google.com?
【发布时间】:2020-05-10 18:18:52
【问题描述】:

我正在尝试使用代理通过 puppeteer 浏览 google.com,但 Chromium 似乎阻止了我。

代码示例:

const puppeteer = require('puppeteer');

(async() => {
    const proxyUrl = 'http://gate.smartproxy.com:7000';
    const username = 'xxxxx';
    const password = 'xxxxx';

    const browser = await puppeteer.launch({
        args: [`--proxy-server=${proxyUrl}`],
        headless: false,
    });

    const page = await browser.newPage();

    await page.authenticate({ username, password });
    await page.goto('https://google.com/');

    const html = await page.$eval('body', e => e.innerHTML);
    console.log(html);
    await browser.close();
})();

错误:

(node:6673) UnhandledPromiseRejectionWarning: Error: net::ERR_TUNNEL_CONNECTION_FAILED at https://google.com/...

我已经在代理端进行了检查,它们正在工作。

如果使用 puppeteer 无法实现(因为他们使用的是 Chromium),您对如何使用代理浏览 Google 有其他想法吗?

谢谢,

【问题讨论】:

    标签: node.js web-scraping puppeteer


    【解决方案1】:

    尝试将 https 替换为 http,并咨询代理服务,看看他们有哪些文件或可以提供哪些建议。或者,找出它是什么类型的代理以及它的正常行为方式,并为我们提供更多信息。

    【讨论】:

      【解决方案2】:

      尝试使用 pluginProxy:

      const puppeteer = require('puppeteer-extra');
      const StealthPlugin = require('puppeteer-extra-plugin-stealth')
      const pluginProxy = require('puppeteer-extra-plugin-proxy');
      (async() => {
        puppeteer.use(StealthPlugin()); // Recommende
        puppeteer.use(pluginProxy({
          address: <proxy-host> ,
          port: <proxy-port> ,
          credentials: {
            username: <proxy-user> ,
            password: <proxy-pwd> ,
          }
        }));
        let browser = await puppeteer.launch({
          headless: false,
          ignoreHTTPSErrors: true // Some proxies need it
        });
        let page = await browser.newPage();
        await page.goto('https://google.com/');
      
        const html = await page.$eval('body', e => e.innerHTML);
        console.log(html);
        await browser.close();
      })();
      

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2021-02-13
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2019-10-25
        • 1970-01-01
        • 2012-04-10
        • 1970-01-01
        相关资源
        最近更新 更多