Scrapy 返回图片 SRC URL 但不下载图片答案

【问题标题】：Scrapy returns image SRC URL but does not download imageScrapy 返回图片 SRC URL 但不下载图片
【发布时间】：2021-06-01 08:49:15
【问题描述】：

我查看了许多示例和类似问题，但无法解决此问题，如果您能提供帮助，谢谢。

我已安装 Pillow，以下设置未注释

SPIDER_MIDDLEWARES = {'takaratomy.middlewares.TakaratomySpiderMiddleware': 543,}
DOWNLOADER_MIDDLEWARES = {'takaratomy.middlewares.TakaratomyDownloaderMiddleware': 543,}

终端没有返回错误并正确返回直接链接但没有下载图像，创建了文件夹但没有保存图像。我猜 items.py 或 pipeline 有一些缺失的信息，为了便于查看，我已经撤回了一些图像结果。

我尝试了默认的 Item_Pipeline，但结果也相同

#ITEM_PIPELINES = {'takaratomy.pipelines.TakaratomyPipeline': 300,}

 <GET https://takaratomymall.jp/shop/g/g4904810104957/> (referer: None)
2021-06-01 17:26:14 [scrapy.core.scraper] DEBUG: Scraped from <200 
https://takaratomymall.jp/shop/g/g4904810104957/>
{'img_urls': ['https://takaratomymall.jp/img/usr/header/tt_logo_tomy1_1.png', 
'https://takaratomymall.jp/img/goods/5/4904810104957_9ddae881c00e43b4866201ccb3c92abe.jpg', 
'https://takaratomymall.jp/img/goods/L/4904810104957_b6d7dcacc3e34ee9863dddd49e432190.jpg',
 'https://takaratomymall.jp/img/goods/C/4904810104957_bf967f02392c4e9190fad6e24f635b8b.jpg', 
'https://takaratomymall.jp/img/goods/1/4904810104957_ad5bfbb36fb6484dbfced3d1f16a17c4.jpg'],
 'images': []}
2021-06-01 17:26:14 [scrapy.core.engine] INFO: Closing spider (finished)

蜘蛛.py

import scrapy

class TakaratomyscraperSpider(scrapy.Spider):
name = 'takaratomyscraper'

start_urls = ['https://takaratomymall.jp/shop/g/g4904810104957']
             

def parse(self, response):
    dlimages = response.css('img ::attr(src)').getall()
    finalimages = []
    for img_urls in dlimages:
        finalimages.append(response.urljoin(img_urls))

    yield {
        'img_urls': finalimages
    }

items.py

import scrapy

class TakaratomyItem(scrapy.Item):
# define the fields for your item here like:
# name = scrapy.Field()
pass

settings.py

BOT_NAME = 'tomybot'

SPIDER_MODULES = ['takaratomy.spiders']
NEWSPIDER_MODULE = 'takaratomy.spiders'

ITEM_PIPELINES = {'scrapy.pipelines.images.ImagesPipeline': 1}
IMAGES_STORE = 'finalimagesfolder'

 ROBOTSTXT_OBEY = False

管道.py

class TakaratomyPipeline:
 def process_item(self, item, spider):
    return item

我已经尝试了几个小时的任何想法

【问题讨论】：

标签： python scrapy

【解决方案1】：

您使用的字段名称不正确。
Scrapy的ImagesPipeline默认使用image_urls，你有img_urls。

如果您真的想要使用您的姓名，可以使用IMAGES_URLS_FIELD 设置进行更改。

【讨论】：

感谢您的反馈，我已将所有出现的 img_urls 替换为 image_urls 但结果相同，没有保存图像，items.py 文件中应该有更多信息吗？感谢您协助解决问题