【发布时间】:2018-07-04 12:15:32
【问题描述】:
我正在抓取网站,这是在 websphere 上制作的。
我看到每当用户登录时,它会在到达主页时点击 4 个 url。
在第三个 URL 中,它有一些看起来像这样的加密值
L0lDU0NTSUpKZ2tLQ2xFS0NXXXXXXXXXXXXXXXXXXX..XXXXXXXXXvZD1vbkxvYWQ!
网址如下所示:
http://example.com/escares/wps/myportal/!ut/p/c1/XXXXXXXXXX/dl2/d1/L0lDU0NTSUpKZ2tLQ2xFS0NXXXXXXXXXXXXXXXXXXX..XXXXXXXXXvZD1vbkxvYWQ!
问题是,我注意到每次登录时只有加密值会发生变化。
websphere 中是否有任何算法可以生成这种 url ?或者有什么方法可以复制这个加密值?
有没有人在 websphere 网站上进行过抓取/抓取?
【问题讨论】:
-
不,这看起来不像任何默认的 wordpress 行为(并且可能与 wordpress 无关)。
-
如果你能确认这是wordpress url 吗? example.com/escares/wps/myportal 左右?
-
不是 Wordpress。可能是 IBM 的 WebSphere Portal。
标签: node.js web-scraping web-crawler websphere