【发布时间】:2011-06-01 22:57:57
【问题描述】:
我有一个用于解析网站 html 的网络爬虫,我正在尝试为它编写测试。
我正在尝试测试的类接收 Nokogiri HTML 对象并从中提取所需的数据。现在和往常一样,html 可能会有所不同,有时元素会丢失或诸如此类。我需要测试这些不同的情况。
所以我想做的是制作一堆 html 文件,每个文件代表一个缺少特定元素的案例等。对于每个 html 文件,我还希望构建我期望的数据的关联哈希要提取的刮刀,假设它工作正常。
所以我想编写一个测试,它将遍历这些 html 文件,并将被测试的类提取的数据与预期数据进行比较,并报告它是否正确。
关于如何做到这一点的任何建议?
【问题讨论】:
标签: ruby-on-rails unit-testing rspec rspec2