【发布时间】:2021-10-21 13:24:13
【问题描述】:
我刚刚开始涉足爬虫之类的东西,并编写了一个简单的代码。我正在尝试访问这个网站https://parimatch.com(这是一个博彩网站),我只想以字符串形式从中获取信息。但我没有从中得到任何东西。这是我的代码:
public static void main(String[] args) throws IOException {
String url = "https://parimatch.com";
WebClient webclient = new WebClient();
webclient.getOptions().setCssEnabled(false);
webclient.getOptions().setJavaScriptEnabled(false);
HtmlPage page = webclient.getPage(url);
System.out.println(page.asText());
}
作为输出,我得到的只是这个:
匹配 ... ... ... ... …… AccessDeniedAccess DeniedF9M61D7DJ91H4VV9/ZwxOdmTFgSBUqONvXN4N+NV5xPMsaZOgXXfD7P1bC/eLXBJRZ4bjiQZ33gXQUwFnjxcCr/1tw4= ... ... ... ...
请有人告诉我为什么我只得到这个或者是什么原因?在这种情况下我该怎么办?
【问题讨论】:
-
您好,您可以通过浏览器访问该网站吗?
-
Yigit Yuskel,是的,我可以访问它
标签: java web-scraping htmlunit