数据爬虫或其他答案

【问题标题】：Data crawler or something else数据爬虫或其他
【发布时间】：2015-11-06 07:29:27
【问题描述】：

我正在寻找一些我不知道该怎么做的东西。我对抓取、报废等方面没有深入的了解，但我相信我正在寻找的技术就是这些。

文本包含“ABC”且不包含“BCZ” 或文本包含“XYZ”且不包含“ATM” 以此类推

我一直在使用 import.io 之类的工具，但我还没有弄清楚如何正确操作！

有人确切知道我在寻找哪种技术吗？谁（什么样的专家，程序员）可以为我构建这个？懂数据爬取的程序员构建它是不是太难了？

抱歉，帖子太长了

【问题讨论】：

嗨，加布里埃尔！正如 Cameron 提到的，backstitch 可以帮助您完成大部分您想做的事情。大声告诉我，我很乐意向您介绍如何构建它：电子邮件 jordan[AT]backstit.ch

【解决方案1】：

对于60个不需要认证的网站：

您可以使用backstitch 之类的工具来标记您要监控的网站，并获取包含您想要的关键字内容的页面的交互式缩略图提要。 Backstitch 支持使用布尔运算符（您描述的 AND / OR 功能），并且有一个 API 可以让您以您需要的格式导出结果。

他们的支持团队（和 CEO）过去在描述他们的 API 如何用于自定义搜索案例方面非常有帮助。祝你好运！

【讨论】：