【发布时间】:2015-06-24 02:50:22
【问题描述】:
我想计算我需要提取的正确数据记录、数据记录总数和提取的不正确数据记录的召回率和精度。
我有输入的 html 页面,我正在从中提取有用的数据并使用包装器生成输出 html 页面。
【问题讨论】:
-
你需要一些东西来比较你的输出。如果您正在评估一个检索系统,您需要一个“理想”(即黄金标准)的检索文档集,您将与之进行比较。在这种情况下,您需要有一组正确的数据记录,可能是手工制作的。
-
请详细写下您的问题并解释您要做什么。
-
我同意@Nilesh,您的问题可能会添加更多细节。另外,为什么对答案投反对票?如果有问题,也许可以评论原因或编辑。
标签: information-retrieval evaluation text-extraction precision-recall