【问题标题】:Scraping images of刮取图片
【发布时间】:2015-10-24 08:10:24
【问题描述】:

我正在尝试使用 import.io 从网站上抓取数据图像

可以在以下位置找到我尝试抓取的示例 http://www.thecar-company.co.uk/used-cars/renault-laguna-1-6-16v-rt-5dr-leamington-spa-201510197972406

这是汽车交易网站。每辆车都显示有一个主图像,然后是一些附加图像。附加图像显示为小图像 (164 x 123)。这些图像的较大版本(640 x 480)可以通过单击图像来查看。

我已经能够抓取所有图像,但只能抓取小版本。我想抓取更大的图像。

**Here is the source code:**
<div id="advertSummaryComponent" class="rzc-advert-summary">
<p class="back"><a href="/used-cars"><span>View all our used cars</span></a>      
</p>
<div class="description">
    <div class="image">
        <div class="item">
            <img src="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=c860b3af7b034ef58afe7d98e53eb964&amp;width=640&amp;height=480" alt="RENAULT LAGUNA Hatchback 1.6 16v RT 5dr" id="item-0" />
            <span id="span-0">Click to enlarge</span>
        </div>                      
        <div class="navs"> 
            <ul>
<li><a href="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=c860b3af7b034ef58afe7d98e53eb964&amp;width=640&amp;height=480" id="nav-0"><img src="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=c860b3af7b034ef58afe7d98e53eb964&amp;width=164&amp;height=123" alt="RENAULT LAGUNA Hatchback 1.6 16v RT 5dr" /></a></li><li><a href="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=9f1012cb998d4b18a70d8e526ccac5bf&amp;width=640&amp;height=480" id="nav-1"><img src="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=9f1012cb998d4b18a70d8e526ccac5bf&amp;width=164&amp;height=123" alt="RENAULT LAGUNA Hatchback 1.6 16v RT 5dr" /></a></li><li><a href="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=2c95074384d84ec8a7919ff644677801&amp;width=640&amp;height=480" id="nav-2"><img src="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=2c95074384d84ec8a7919ff644677801&amp;width=164&amp;height=123" alt="RENAULT LAGUNA Hatchback 1.6 16v RT 5dr" /></a></li><li><a href="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=0e957848e1b74f67ac6e1d69c5f5e2cc&amp;width=640&amp;height=480" id="nav-3"><img src="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=0e957848e1b74f67ac6e1d69c5f5e2cc&amp;width=164&amp;height=123" alt="RENAULT LAGUNA Hatchback 1.6 16v RT 5dr" /></a></li><li><a href="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=3746daefe8504eaab8ad1ba59de74a5e&amp;width=640&amp;height=480" id="nav-4"><img src="http://pictures2.autotrader.co.uk/imgser-uk/servlet/media.jpg?id=3746daefe8504eaab8ad1ba59de74a5e&amp;width=164&amp;height=123" alt="RENAULT LAGUNA Hatchback 1.6 16v RT 5dr" /></a></li> 
            </ul>    
        </div>

绝对的 XPath 是: /html/body/table/tbody/tr[205]/td[2]/span[2]/a

我正在尝试获取相对 XPath 我正在尝试创建一个相对 XPath,但没有成功。

谁能帮忙?

【问题讨论】:

  • “相对 xpath”?相对于什么
  • “这是汽车交易网站” – 使用他们的 API。如果他们不提供,请停止窃取他们的内容。 (或者你有他们的明确许可吗?)
  • 这个项目是给这家汽车贸易公司的。它还将包括其他汽车贸易公司,所有这些公司都签署了允许使用该内容的协议。
  • 而且他们没有 API。

标签: image xpath import.io


【解决方案1】:

只对框中的图像使用绝对 XPath 怎么样?

//*[@id="cboxLoadedContent"]/img

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-12-19
    • 2017-11-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-11-10
    • 2019-06-04
    • 2015-09-02
    相关资源
    最近更新 更多