【发布时间】:2019-07-26 10:13:00
【问题描述】:
我想抓取我的网上银行网站。我有多个银行账户(在不同的银行),需要定期提取最新交易以查看我的总体支出并监控我的支出。目前我必须访问每个银行网站,提取提取物,将它们转储到 excel 文件中,执行一些重新格式化和过滤。我想自动化整个过程。首先要有一个程序,该程序可以自动从我的银行账户中提取转账历史记录。
我了解了如何使用请求和漂亮的汤库抓取需要登录数据的网站。 我了解您通常需要构建一个“有效负载”字典,其中包含: 1. 用户名 2.密码 3.网站提供的token值
在我的大通银行的情况下,我找不到令牌值但找到了行:
<div id=”securityToken” class=”logon-xs-toggle hidden”>
<input id=”securityToken-input-field” class=”jpui logon-xs-toggle” min=”0” placeholder=”Token” format=”” aria-describedby=“securityToken-placeHolderAdaText securityToken-helpertext” autocomplete=”off” maxlength=”35” name=”securityToken” data-validate=”securityToken” required=”” value=”” type=”tel”>
<span id=”securityToken-placeholderAdaText” class=”util accessible-text validation__accessible-text”>Token</span>
</div>
如何确定我需要的 securityToken 值? 谢谢
【问题讨论】:
-
“我想抓取我的网上银行网站”——这可能会非常困难。大多数银行网站对任何看起来很“有趣”的东西都非常敏感。你在这里的实际目标是什么?为什么要这样做?
标签: python selenium web-scraping python-requests onlinebanking