【问题标题】:How to effectively use the OpenCorporates Reconciliation API?如何有效地使用 OpenCorporates Reconciliation API?
【发布时间】:2019-12-10 01:13:25
【问题描述】:

如何使用 opencorp API? 比如

根据网站:

Open Refine Reconciliation API 允许 OpenRefine 用户将公司名称与合法的公司实体相匹配。当您拥有包含许多公司的现有电子表格或数据集时,这尤其有用。与法人实体匹配(或核对)可让您获得有关公司的更多信息(例如注册地址或法定文件),并更容易与其他数据集匹配或与其他组织交换。

按照文档:Documentation

我可以在邮递员中运行 GET 查询,如下所示:

https://opencorporates.com/reconcile/suggest?prefix=AMAZON

甚至搜索特定区域内的公司。

这在个别情况下非常好和有用,但我有 2 个问题。

1) 如何将其推广到更大的数据集。

2) 根据该网站,它还说:

与法人实体匹配(或核对)可让您获得有关公司的更多信息(例如注册地址或法定文件)。

我如何访问这些信息?

文档中的 GET 响应未显示此信息。

【问题讨论】:

    标签: python get python-requests postman openrefine


    【解决方案1】:

    OpenCorporates 实现的对账 API 由 OpenRefine on its wiki 指定。

    要协调较大的数据集,您应该使用多查询模式,如下所示:

    https://opencorporates.com/reconcile?queries={%22q0%22%3A{%22query%22%3A%22cambridge%20analytica%22},%22q1%22:{%22query%22:%22mossack%20fonseca%22},%22q2%22:{%22query%22:%22danske%20bank%22}}

    这是上面请求中queries参数的可读版本:

    {
      "q0": {
        "query": "cambridge analytica"
      },
      "q1": {
        "query": "mossack fonseca"
      },
      "q2": {
        "query": "danske bank"
      }
    }
    

    要从协调 API 返回的记录中检索更多信息,您需要使用他们的 REST API,因为他们的协调端点目前不支持 OpenRefine 指定的 Data Extension API。如果您想在多条记录上使用它,您将需要为此获取一个 API 密钥。

    【讨论】:

    • 这种方法对 1000 行有效吗?你也知道如何带回注册地址等额外信息吗?如果由于权限问题无法在我的系统上安装 OpenRefine,这可以在 python 中实现吗?
    • 查看我上面关于获取额外数据的编辑答案。你完全不需要安装 OpenRefine 来使用这个 API,你完全可以直接在 Python 中实现它。
    • 好的,看看那个。 REST API 是否让我能够根据名称的相似性对公司进行排名?那么我可以说列出公司列表并为该列表中的每家公司返回前 3 个最接近的匹配项吗?那是不是很容易实现?
    • 我会先使用对帐 API 来检索候选人,然后使用 REST API 来检索有关这些候选人的信息。
    • 这是有道理的。你能给我一个具体的例子来说明如何只为一家公司获取这些信息吗?因此,一个查询是让核对 API 返回分数,然后一个查询是让 REST API 返回一些其他信息(例如地址)?
    【解决方案2】:

    使用 OpenRefine:它拥有您所要求的一切以及更多,重写它不会花很多精力。
    解决您的权限问题。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-06-29
      • 1970-01-01
      • 1970-01-01
      • 2023-04-03
      • 2012-05-25
      • 1970-01-01
      • 2011-07-09
      相关资源
      最近更新 更多