【发布时间】:2012-01-12 16:56:28
【问题描述】:
我的python级别是新手。我从来没有写过网络爬虫或爬虫。我已经编写了一个 python 代码来连接到一个 api 并提取我想要的数据。但是对于一些提取的数据,我想得到作者的性别。我找到了这个网站http://bookblog.net/gender/genie.php,但缺点是没有可用的 api。我想知道如何编写一个python来向页面中的表单提交数据并提取返回数据。如果我能在这方面得到一些指导,那将是一个很大的帮助。
这是 dom 的形式:
<form action="analysis.php" method="POST">
<textarea cols="75" rows="13" name="text"></textarea>
<div class="copyright">(NOTE: The genie works best on texts of more than 500 words.)</div>
<p>
<b>Genre:</b>
<input type="radio" value="fiction" name="genre">
fiction
<input type="radio" value="nonfiction" name="genre">
nonfiction
<input type="radio" value="blog" name="genre">
blog entry
</p>
<p>
</form>
结果页面 dom:
<p>
<b>The Gender Genie thinks the author of this passage is:</b>
male!
</p>
【问题讨论】:
标签: python web-crawler web-scraping