【问题标题】:Statistics about "Microformat vs HTML+RDFa" adoption“Microformat vs HTML+RDFa”采用率统计
【发布时间】:2015-04-20 23:28:11
【问题描述】:

是否有关于这些标准中的“网络使用”(使用一种或另一种标准的网页)的一些最近和可靠的统计数据?

或者关于 vCard(个人和/或组织)使用范围的具体统计数据?

只有统计数据,这个问题不是关于“什么是最好的想法?”或“如何使用它?”。查找统计数据以比较 Microformats adoption(any kind of) RDFa in HTML adoption

我们可以认为,对于“计数页面”统计,Microdata 是一种 RDFa-HTML。


注意事项

解释上下文

RDFa Lite 是唯一的W3C recommendation,当我们谈论“微数据与微格式”时,微数据与 RDFa Lite 有更好的映射关系。 HTML5 在 2014 年 10 月 28 日成为了 W3C 的推荐标准,没有一个没有得到 W3C 的祝福。我知道schema.org 是采用(重用社区模式)RDFa 的最佳方式。

另一方面,Microformats 更老,也最简单;所以,也许是 Web 中最常用的(!?是吗?)。

关于“电子名片数据统计”

如果我们需要一些 范围 来进行统计,让我们使用 vCard 作为范围:

  • Microformat 的 hCardh-Card 是在(任何)HTML 上显示 vCard 的标准,用于个人和组织。

  • schema.orgPersonOrganization 使用(标准)RDFa Lite 或微数据对 vCard 信息进行编码。

其他说明

维基百科表达了一个旧的(2012 年)和不可证实的断言(没有来源!),“然而,像 hCard 这样的微格式继续在网络上发布,而不是模式和其他”,而Webdatacommons是一团糟,没有统计报告。

(编辑)现在维基百科的引用错误已修复。


(在@sashoalm 评论后编辑) 请注意那些不同意这个问题是有效的。

这个问题是软件问题,而不是“请求异地资源”...

问题:要决定项目中的库、框架、数据模型等,我们需要使用在今天和未来几年内使用的工具...... project decisions 在软件开发中,我们需要关于用户趋势、框架采用等的统计数据。

PS:在 Stackoverflow 中,有很多关于语言统计的讨论,即相同“问题集”。示例:123456。另请参阅questions tagged with [usage-statistics]

【问题讨论】:

  • 不属于“要求我们推荐或查找书籍、工具、软件库、教程或其他场外资源的问题与 Stack 无关溢出,因为它们往往会吸引自以为是的答案和垃圾邮件。相反,请描述问题以及迄今为止为解决问题所做的工作。"?
  • @sashoalm 我编辑了,删除前请在这里查看和讨论。
  • 别担心,我不能自己删除问题。

标签: usage-statistics microformats rdfa


【解决方案1】:

现在我看到了,有一些统计数据(!!),维基百科的链接丢失了......我更正了。它没有更新,来自“Winter 2013”​​(大约 1.5 或 2 年前收集的数据),但显示了现实和趋势。

http://webdatacommons.org/structureddata/index.html#toc2

这是报告中的图表(RDFa+HTML 占主导地位!):

口译

  • 第 5 节,“提取过程”,说 “在每个页面上,我们都运行我们的 RDF 提取器,该提取器基于“Anything To Triples (Any23) 库”,所以所有(RDF 和微格式)导致“三元组”(不仅仅是 RDF)。

  • “每个域”统计的想法是域对所有页面使用统一的政治......但我认为这种统一性是错误的,每个域只有少数页面采用“语义标记”......它并不比网址,只是另一张图片。无论如何,结果是死气沉沉,~57% vs 43%。

  • 2013 年的“语义标记 URL”中只有 21% 是 Microformat,其他都是 RDFa-HTML(Microdata 也是 RDFa 的一种)。

  • 使用域 (Ds) 和 URL (Us) 百分比的平均值 (Ds+Us)/2,RDF 的结果约为 60%,微格式的结果约为 40%。

  • 在 2013 年之前,微格式占主导地位,因此,“RDFa-HTML”自 2011 年以来的大幅增长是显而易见的......趋势很明显。

  • 如果我们采用“每个域”和“每个 URL”计数的算术平均值,我们的 Microformats 和 RDFa-HTML 彼此接近,但 Microformat 几乎没有(并且 RDFa-HTML 的强烈趋势在 2014 年增长)。

这是@sashoalm 讨论的表格,显示百分比和总数


注意 1:HTML5 仅在 2014 年 10 月 28 日发布,因此只有 ~2015 年 10 月,我们才能检查新标准对 Web 的真正(确定)影响。一个重要的预期影响是Microdata没有受到HTML5的祝福,所以唯一的标准是HTML+RDFa(推荐RDFa Lite)......未来也许会有更少的微数据和更多schema.org

注意 2:boilerplate text 的网页计数方法问题,带有一些巨大的“语义标记”:我认为 “下一代”统计数据可以使用一些“每个域” analisys" 以对 diversity(语义标记的页面)进行 URL 子统计(抽样)。理想的是称重(p. ex. 计算一次非克隆并使用克隆的1+SQRT(count))样板。

结论

今天也许有些人使用 Microformat,但是 Web 中有更多的页面使用 RDFa-HTML(Microdata、RDFa、RDFa Lite 等),并且趋势是增长。

如果您的项目是在未来几年,统计数据表明使用 RDFa。


注意

RDFa 的另一个有趣计数不是使用,而是词汇表的重用(!)。见Linked Open Vocabularies (LOV)

【讨论】:

  • 有趣。如果您查看截至 2013-11 年每种格式的结果,微格式正在扼杀竞争。 webdatacommons.org/structureddata/2013-11/stats/stats.html
  • 不同意网站中语义的重复。很有可能,如果它们甚至被使用,就会有人关心并重复它们。另一个明显的例子是页脚中的 hcard,它位于站点上的每个文档上。但这是一个很棒的演讲。不确定 cmets 或 answers 是否是在这里来回的正确方法,但我喜欢它
  • hum... 关于“微格式扼杀竞争”,你看到了什么我没看到? 请检查您是否将 Microdata 与 Microformat 弄错了(Microdata 是 RDFa)。您链接上的图表是我在此处显示的图表...这里的第一个图表是“带有三元组的 URL”,它仅显示约 25% 的微格式。
  • @albert, (okedited with a table) 关于格式,你必须使用 sum "html-rdfa"+"html-microdata"... 即使在域列中(但请参阅我的 cmets 反对它(!),这不是“杀死”结果,它只有 57% 对 43%。在 URL 列中,RDFa 以 79% (!)获胜。
  • @albert,请更正并补充我的答案(和我的英语),现在它是一个 Wiki(您可以编辑!)...您可以添加您的好发现。我还需要您在 Wikipedia 的 RDFa/statistics articleRDFa/variants... 上进行评论...我显然是独自工作的。
【解决方案2】:

来自WebDataCommons的最后统计如下:

来源:http://webdatacommons.org/structureddata/2016-10/stats/stats.html

解析的域数:3400 万个付费级域
具有 RDFa、微数据和微格式的域数量:563 万 (16.5%)

不同格式的流行:

【讨论】:

  • 您好,Intendia,谢谢!另见this answer showing JSON-LD vs markup semantic,我们可以将 RDFa+Microdata+microformat 相加为“makup语义”,因此在宇宙中有 73% 标记27% JSON-LD表达语义的领域(775 万)。
猜你喜欢
  • 1970-01-01
  • 2019-05-10
  • 2021-09-30
  • 2014-01-13
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多