【问题标题】:Jsoup html parse region language settings javaJsoup html解析区域语言设置java
【发布时间】:2016-08-11 07:17:14
【问题描述】:

如何像在其他国家/地区一样解析 HTML 数据?

我尝试过使用代理(代码):

System.setProperty("http.proxyHost", "some proxy");
System.setProperty("http.proxyPort", "some port");

但它不能正常工作。我仍然以我的国家语言获取数据。

我也尝试过使用 VPN,但是当我执行我的程序(Jsoup 解析器)时,并没有下载任何东西。

编辑:

感谢您的宝贵时间,标记的答案帮助我解决了问题。我找到的完整解决方案there

【问题讨论】:

  • 你的意思是在不同的语言环境中下载页面并解析它?
  • 我的意思是获取页面的 html,因为我在不同的位置。网站会自动定位我的位置并设置语言,但我需要其他语言。

标签: java proxy jsoup html-parsing region


【解决方案1】:

这取决于您要下载的网站。如果站点使用 IP 地理定位,唯一的解决方案是使用适当的代理:https://stackoverflow.com/a/1433296/1608594

如果站点仅使用 HTTP 标头来确定语言,您可以发送具有正确值的 Accept-LanguageAccept-CharsetAccept-Encoding 标头。 https://en.wikipedia.org/wiki/List_of_HTTP_header_fields#Request_fields

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2011-02-05
    • 2012-12-18
    • 2011-12-11
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多