【发布时间】:2013-12-22 15:25:15
【问题描述】:
我正在尝试获取
的完整网页'http://www.bloomberg.com/markets/economic-calendar/'
但由于某种原因,我找不到将链接作为字符串返回的函数。 我想将彭博页面上的所有公告转换为 CSV 文件,但我不确定如何。 CSV 文件将包含以下内容:
周一 12.2 盖洛普美国消费者支出衡量标准 [报告][Bullet8:30 AM ET
本·伯南克演讲 美国东部时间上午 8:30
PMI 制造业指数 [报告][djStar]东部时间上午 8 点 58 分
ISM制造指数 [报告][星]美国东部时间上午 10:00
建筑开支 [报告][djStar]美国东部时间上午 10:00
建筑开支 [报告][djStar]美国东部时间上午 10:00
4 周账单公告 [报告][Bullet11:00 AM ET
(这只是从网站上复制和粘贴的)。
什么是最好的使用方式或最好的库?
【问题讨论】:
-
import csv import urllib.urlopen import beautifulsoup -
你能给我一个关于我应该搜索什么的指针吗?我是网络抓取的新手。谢谢你的回复。
-
那是因为没有将链接作为字符串返回的“函数”。 Python 很棒,但它不是魔法!
标签: python-2.7 web-scraping urllib2 urllib bloomberg