【发布时间】:2016-05-10 16:17:13
【问题描述】:
我正在使用 robobrowser 抓取此页面,页面内有一个 textarea 标记,其中包含我需要复制和存储的信息。
这是我的代码:
>>> captchacode = captchabrowser.find('textarea')
>>> print(captchacode)
<textarea cols="100" rows="5">03AHJ_VuvjiQUpaQ-JFLXqAJaUQ217f7bHqa3hG__VSG1YsbjNtsT2FGFrJksCansOxwuxniksyCsnHJTvlCeGdi2jeqUyuDfUGAQ1WIuJqO55ACslBSUnd-MtAMDIOmbTa1G9uh1QMBdZUTRXwmt1kOn7oNf6ZflnUGAtIOGeTSgx-wu8hOWY-Pw</textarea>
如何获取文本
<textarea cols="100" rows="5">XXXXXX</textarea>
我需要他们自己在一个变量中的XXXXX。
【问题讨论】:
-
存在格式错误,将数据“放入”文本区域是错误的 HTML。应该是
<textarea value="XXXXX"></textarea>,请注意这一点。 -
@aarongillion 我从中抓取的网站就是这样,我无法更改它:(
-
没关系,我只是指出来了。
标签: python html beautifulsoup screen-scraping robobrowser