【发布时间】:2020-10-05 07:48:10
【问题描述】:
我对 Puppeteer 所需的参数有点困惑,尤其是在使用 puppeteer-extra stealth 插件时。我目前只使用所有默认设置和 Chromium,但是我不断看到这样的示例:
let options = {
headless: false,
ignoreHTTPSErrors: true,
args: [
'--no-sandbox',
'--disable-setuid-sandbox',
'--disable-sync',
'--ignore-certificate-errors'
],
defaultViewport: { width: 1366, height: 768 }
};
我真的需要其中任何一个来避免被发现吗?一直在使用 Puppeteer 而没有设置任何它们,并且它通过了开箱即用的机器人测试。 --no-sandbox 是干什么用的?
【问题讨论】:
-
--no-sandbox: "为所有通常被沙盒处理的进程类型禁用沙盒。仅用于测试目的的浏览器级别开关。" -
--disable-sync: "禁止将浏览器数据同步到 Google 帐户" -
@kavigun 所以我不需要
--no-sandbox对吧?我没有测试任何东西。只是运行 puppeteer -
@Kex 如果只有无头浏览器无法启动(在某些 linux 系统上),我建议您使用它。对您不信任的页面使用该标志可能会带来巨大的安全风险。我不认为你不需要它 puppeteer-extra-plugin-stealth 也能正常工作
标签: javascript puppeteer