【发布时间】:2015-04-29 20:19:36
【问题描述】:
我正在尝试从 MLB 网站上抓取有关 MLB 球员的一些信息。 但是,使用 urllib2 和 BeautifulSoup,我在 'div' 下找不到内容。但我可以清楚地看到 Chrome 上的内容。
例如,转到页面 (http://mlb.mlb.com/team/player.jsp?player_id=150378)。右上角的状态信息显示“已发布”。但我无法使用 BS4 找到此字符串/内容。
这是我的代码:
base_url = 'http://mlb.mlb.com/team/player.jsp?player_id=150378'
request = urllib2.Request(base_url)
response = urllib2.urlopen(request)
soup = BeautifulSoup(response)
player_status = soup.findAll('div',id='player_status')
print player_status
我期待它有一个像“状态:已发布”这样的字符串, 但结果只显示
[<div id="player_status"></div>]
我以前从未遇到过这个问题。有人可以帮我弄这个吗? 谢谢!!
【问题讨论】:
标签: python web-scraping beautifulsoup