【问题标题】:Error during a wikidata updatewikidata 更新期间的错误
【发布时间】:2018-11-14 00:25:59
【问题描述】:

我使用指令here 创建了一个本地版本的wikidata api,在使用默认选项运行munge.sh 之后,我运行了 ./runUpdate.sh -n wdq 导致以下错误消息。

ERROR org.wikidata.query.rdf.tool.Update - 
RDF store reports the last update time is before the minimum safe poll time.
You will have to reload from scratch or you might have missing data.

这是什么意思?我应该在更新之前再次munge吗?

【问题讨论】:

  • 可能您的 RDF 转储已过时,它似乎应该是 30 天或更短:github.com/wikimedia/wikidata-query-rdf/blob/master/tools/src/…
  • 谢谢,所以我应该下载一个新的转储文件并从头开始?另外,请考虑写下您的评论作为答案,以便我接受。
  • 假设您的转储日期为 2017-08-01,可能您可以将系统日期设置为 2017-08-20 并运行runUpdate.sh,然后将系统时间设置为当前时间并运行此脚本再次...
  • 谢谢,我不断收到HTTP request failed: java.util.concurrent.ExecutionException: java.net.ConnectException: Connection refused,但也许这是一个不同的问题。
  • 在将客户端日期设置为 2017-08-20...

标签: wikidata wikidata-api


【解决方案1】:

默认更新程序当前只能根据 wiki 的最近更改中的内容进行更新。 默认值为 30 天,因此如果您导入的转储时间超过 30 天,更新程序将失败。

现在可以将一些选项传递给更新程序脚本,以查看更长时间的最近更改的历史记录。 您还可以设置执行检查的最后一个更新程序三元组。

可以在https://phabricator.wikimedia.org/T182394 中讨论这些选项(但我不确定当前是否存在更好的文档):

  • "wikibaseMaxDaysBack" 可用于设置在最近更改中回顾的最大天数
  • “init”可用于设置最后更新的三元组

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2017-09-27
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-11-24
    • 2013-11-09
    • 2021-01-18
    • 2015-06-26
    相关资源
    最近更新 更多