【问题标题】:How to know if a website is non-english?如何知道一个网站是不是英文的?
【发布时间】:2015-08-23 23:47:43
【问题描述】:

我正在做一些类似检测网站语言的事情。它大约有 1k 个网站,所以我不能一个接一个地做。我认为这样做我需要通过 python 获取网站 html 代码并获取所有文本,进行分析。是否正确,有没有人做过这样的事情,这将非常有帮助:)

【问题讨论】:

  • SO 不是代码编写服务。请展示您的尝试以及您可能遇到的任何错误。
  • stackoverflow.com/questions/4605062/… 这可能会有所帮助
  • 你是指代码还是内容?支持多种语言/i18n 的网站呢?

标签: python html


【解决方案1】:

谢谢大家的回答,我找到了解决办法。通过列出网站的alexa排名和访问最多的国家。如果是美国或其他英语国家,那么它是英文网站。

用 python 做的。

【讨论】:

    猜你喜欢
    • 2012-04-05
    • 1970-01-01
    • 1970-01-01
    • 2018-01-03
    • 2022-01-01
    • 2011-05-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多