【发布时间】:2010-11-06 19:47:56
【问题描述】:
我发现HTML Agility Pack 对屏幕抓取网站非常有用且易于使用。在 Java、Ruby、Python 中用于 HTML 屏幕抓取的等效库是什么?
【问题讨论】:
标签: java python html ruby screen-scraping
我发现HTML Agility Pack 对屏幕抓取网站非常有用且易于使用。在 Java、Ruby、Python 中用于 HTML 屏幕抓取的等效库是什么?
【问题讨论】:
标签: java python html ruby screen-scraping
找到了我要找的东西: Options for HTML scraping?
【讨论】:
BeautifulSoup 是标准的 Python 屏幕抓取工具。
不过,最近我用了pyQuery(目前不完整),这或多或少是把jQuery改写成python,发现它非常有用。
【讨论】: