【发布时间】:2011-03-19 14:25:14
【问题描述】:
我对 reCAPTCHA 的工作原理有点困惑。我已经实现了 使用 ROR。
有时即使我只指定两个单词中的一个,它也会返回 true 虽然有时会失败。
我真的很困惑,无法理解 重新验证码。
【问题讨论】:
我对 reCAPTCHA 的工作原理有点困惑。我已经实现了 使用 ROR。
有时即使我只指定两个单词中的一个,它也会返回 true 虽然有时会失败。
我真的很困惑,无法理解 重新验证码。
【问题讨论】:
Recaptcha 显示两个单词。一种是计算机扫描仪已扫描并识别的,另一种是计算机扫描仪无法识别的。 Recaptcha 检查它知道答案的单词并保存未知单词的响应。这些对未知单词的反应被编译和分析,因此它本质上是由人类而不是由计算机扫描仪“解决”的。
这里有更多信息,用他们自己的话来说:
“但是如果计算机无法读取这样的 CAPTCHA,系统如何知道谜题的正确答案?方法如下:OCR 无法正确读取的每个新单词都会与另一个单词一起提供给用户答案已知的单词。然后要求用户阅读两个单词。如果他们解决了已知答案的单词,则系统假定他们的答案对于新的单词是正确的。然后系统给出新的图像以更高的信心确定原始答案是否正确。”
【讨论】:
我认为这是recaptcha 的要点。它可以帮助开发人员在人类和机器人之间做出改变,还有助于将书籍数字化。
总是有两个词。一个更容易阅读。如果你能读懂这个词,那很好,你是人类。
第二个单词是自动 OCR(识别)无法确定该单词的书中的扫描图。所以用户正在帮助阅读这个词,以便书籍可以更好地数字化。
【讨论】:
Recaptcha 使用两个词,一个是已知的,一个是未知的(未知词是程序试图帮助破译的词——它可能是从一本旧书或某处扫描出来的!)。所以真的,所有服务都在寻找对已知词的正确答案。如果这是你输入的词,即使你不为未知词输入任何内容,它也会成功。如果你输入另一个词(未知词),它会失败。
【讨论】:
系统只有一个 recaptcha 词是“已知的”——它依靠执行验证码的用户来告诉系统另一个词是什么,因为它不是机器可读的。
这就是 recaptcha 的“重点”,或者说它的附加好处 - 它不仅是执行人工测试,而且还是自动化 OCR 失败的大规模群源翻译。
【讨论】: