【问题标题】:Trouble accessing rdf data from Sponger从 Sponger 访问 rdf 数据时遇到问题
【发布时间】:2015-05-27 23:18:53
【问题描述】:

我目前正在做一个使用Virtuoso Sponger 的项目。我遇到了多个问题,在问这些问题之前我参考了很多材料。由于我是Virtuoso的新手,请耐心等待。

  1. 我似乎无法使用Sponger pagehttp://{virtuoso-host}/about/data/{format}/{URIscheme}/{authority}/{local-path} 中给出的这种格式访问 RDF 数据

我在linkeddata.uriburner.com 和安装了 Virtuoso 的个人服务器上都进行了尝试。 我在地址栏中写了这个——

http://linkeddata.uriburner.com/about/data/xml/http://www.bbc.co.uk/music/artists/ed2ac1e9-d51d-4eff-a2c2-85e81abd6360%01artist

——得到了这个错误——

Error HTTP/1.1 404 File not found
The requested URL was not found
URI  = '/about/data/xml/http:/www.bbc.co.uk/music/artists/ed2ac1e9-d51d-4eff-a2c2-85e81abd6360artist'
  1. 当我尝试 HTML 时—— http://{virtuoso-host}/about/html/{URIscheme}/{authority}/{local-path} — 浏览器输入选项,我从服务器获得的数据输出比从linkeddata.uriburner.com 获得的数据少得多。我该如何纠正这个?

我的主要目标是从社交媒体和信息网站获取 RDF 数据,并将其存储在数据库中以供本地搜索。例如,BBC 有关于 Bob Marley 的信息;维基也是如此。我从他们两个那里获取结构化数据,取出冗余数据,然后添加新数据,以便创建一个对象。我希望从数据库中查询这些数据。

如何通过使用浏览器输入法将这些数据存储到数据库中?

另外,假设这些数据存储在图表下(我在 Virtuoso Conductor -> LinkedData -> Graph 中看到了它的链接) ;那我怎么查询呢?

【问题讨论】:

    标签: virtuoso linked-data


    【解决方案1】:

    Shrivansh,

    这里有很多问题,所以我将提供一个广泛的答案。

    Sponger 将把 Web 资源 转换为 基于 RDF 的链接数据。转换后的数据最终出现在 Virtuoso 托管的 RDF 文档中,该文档由 Named Graph IRI 标识。

    给定一个 Web 资源 URL —

    http://www.slideshare.net/kleinerperkins/internet-trends-v1

    ——您可以将提取、转换和加载 (ETL) 服务 URL 构造为——

    http://linkeddata.uriburner.com/about/html/http/www.slideshare.net/kleinerperkins/internet-trends-v1

    以上结果如下:

    使用本地 Virtuoso Sponger 实例时,请注意以下几点:

    • 您必须为目标数据源(例如, Slideshare、LinkedIn、Facebook、Twitter 等)
    • 实时 URIBurner.com 实例安装和配置了许多墨盒和元墨盒 - 因此您会看到比本地更多的结果(除非您还在本地实例上安装并启用所有 asme 墨盒)
    • A list of available cartridges

    【讨论】:

    • 感谢 Kingsley 的回答,我确实注意到了备用文档类型链接和页脚并使用了它们,但正如问题的第 1 部分所述,当我尝试获取 RDF 数据时直接以 N-Triples(nt) 或 XML(xml) 格式而不是 html 格式(在第 2 部分中)我得到一个错误,如图所示。没有直接的方法可以将它作为 nt 或 xml 文件获取吗?此外,当我们编写查询时,我们如何将 Graph 存储在数据库中并检索它以进一步查询?在链接数据的图表部分中,我看到了我尝试查询的链接,但它们不是特定格式。
    • 另外当你说我需要额外的墨盒并且需要为不同的站点配置它们时,你的意思是除了我在导体中的 Sponger/Extractor 墨盒下看到的那些吗?
    • 要获取 Turtle 文档,请使用:linkeddata.uriburner.com/about/data/turtle/http/… 要获取 RDF/XML 文档,请使用:linkeddata.uriburner.com/about/data/xml/http/www.slideshare.net/…。至于墨盒,我指的是您在指挥中看到的那些。它们并非全部默认启用,因为有些需要 API 提供者提供的 API 密钥。
    • 我认为当我尝试使用 RDF/XML 文档时,它可能因为墨盒配置不正确而无法正常工作? (因此出现第 1 部分中的错误)另外,我如何将结果存储在数据库(rdf)中,然后检索它们以供以后查询?
    猜你喜欢
    • 1970-01-01
    • 2014-02-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-12-11
    • 2023-03-25
    • 1970-01-01
    相关资源
    最近更新 更多