【发布时间】:2018-09-13 06:59:06
【问题描述】:
当你在 R 中抓取链接时使用 rvest 或 RSelenium,你可以通过定义 HTML 代码的开始部分来做到这一点,例如给定节点内的 href。如果我遇到以下 2 个链接怎么办:
<a href="some_link" data-tracking="click_body" data-tracking-data='{"touch_point_button":"photo"}' data-featured-tracking="listing_no_promo">
<a href="some_link" data-tracking="click_body" data-tracking-data='{"touch_point_button":"photo"}' data-featured-tracking="listing_promo">
如您所见,它们仅在最后一部分有所不同。你知道我怎样才能抓住(定义)只有促销/无促销的链接吗?
【问题讨论】:
-
试试 SelectorGadget:selectorgadget.com
-
不幸的是它没有帮助
-
你要废弃的网站是什么?
-
带有房地产广告的波兰网站,这里是示例链接:otodom.pl/sprzedaz/mieszkanie/?page=1