【发布时间】:2013-04-03 21:54:23
【问题描述】:
我想编写一个程序来搜索一个相当大的网站并提取某些内容。我有几个在线 Python 课程,但都没有提到如何使用 Python 访问互联网。我不知道我应该从哪里开始。
【问题讨论】:
-
您需要阅读有关 HTTP、HTML 和可能的 JS/PHP/等的内容,可能在列表中深入了解 DOM,然后了解文本解析/处理。查看 urllib/urllib2/httplib/requests/etc,以及 BeautifulSoup 甚至 Selenium 之类的东西,具体取决于您需要的复杂性和交互性。
-
你看过the Python documentation吗?顺便说一下,Google 上“Python Internet”的第一个结果...