【发布时间】:2023-02-09 09:04:50
【问题描述】:
我想使用此站点从 https://www.whois.com/whois/ 中提取域数据,例如获取名为 tinymail.com 的域的信息我想使用 https://www.whois.com/whois/tinymail.com,如果我先在浏览器中打开它,soup 会提供可靠的数据,否则不会收到域数据(我想这就像网站将数据放在缓存中一样)。我不想使用 selenium 方法(因为它会增加所需的时间)我已经尝试在 inspect element 中检查网络选项,但只看到两个更新,没有一个显示任何数据。
【问题讨论】:
-
不要刮,use an API。
-
根据@AlexHowansky。提供了一个 API。替代方法是使用
requests库。 -
API 是付费的,所以我想去抓取路径。我会使用 python-whois 库,但端口 43 在防火墙中被阻止(我不允许启用它)。
标签: python php python-3.x web-scraping