【发布时间】:2015-10-31 11:32:52
【问题描述】:
我正在尝试从http://www.oddsportal.com/basketball/usa/nba-2014-2015/results/ 中的表中抓取数据
我想要的特定表有 class="table-main"
从 scrapy response.xpath('//table') 运行
In [28]: response.xpath('//table')
Out[28]:
[<Selector xpath='//table' data=u'<table>\n\t\t\t\t\t\t\t\t<tr>\n\t\t\t\t\t<td c
lass="bol'>,
<Selector xpath='//table' data=u'<table class="table-main top-event">\n\t\t\t'>
,
<Selector xpath='//table' data=u'<table>\n\t\t\t\t\t<tr>\n\t\t\t\t\t\t<td>\n\t\
t\t\t\t\t\t<tab'>,
<Selector xpath='//table' data=u'<table class="rm-bonus-offer">\n\t\t\t\t\t\t\t
\t<'>,
<Selector xpath='//table' data=u'<table>\n\t\t\t\t\t<tr>\n\t\t\t\t\t\t<td>\n\t\
t\t\t\t\t\t<tab'>,
<Selector xpath='//table' data=u'<table class="rm-bonus-offer">\n\t\t\t\t\t\t\t
\t<'>]
不返回我希望抓取的表。任何人都可以帮忙吗?
【问题讨论】:
-
您可以使用
'id("tournamentTable")'获得它,但请检查其中的信息是否是动态加载的。使用firebug(或类似的东西)检查哪个请求(另一个来自原始)包含tournamentTable
标签: python-2.7 web-scraping scrapy ipython