由于爱奇艺一直在改规则,所以电视剧的每一次点击都会跳入到第一集的页面,但是这个页面无法采集到其他集数,所以我们需要找到他的剧集页面,经过查找,第一集的源码里边有一段 {"albumId":216266201,"albumName":"知否知否应是绿肥红瘦","albumUrl":"//www.iqiyi.com/a_19rrhcuh85.html", 这个就是剧集页,把他提取出来,组成 https://www.iqiyi.com/a_19rrhcuh85.html 这样的地址,然后去访问他的页面源码
当然大家可以在浏览器的源码页中Ctrl+G的快捷键,直接输入albumUrl,就会定位过去,目前来说,这个方法是通用的,如果爱奇艺又改规则了,自已得重新查找
这个页面,在火车头采集器上可以这么写,新建多页,多页名称命名为剧集,选择从当前页源代码中获取,正则匹配内容和组合结果如图所示
建好多页以后,需要回到播放地址的标签中,选中该标签在分页中匹配,右下边的所属多页,下拉就会发现我们之前命名好的剧集就在这里,选中他即可,标签里边的提取数据方式,就是从这个剧集页面源码中采集
当然大家如果会易语言等编程,也可以自行制作爬虫类软件
这个是我易语言自已写出来的,属于自已使用的软件
好了,简单教程到此结束,有问题可以联系QQ962508652