luobobobo

前言:

对于一组很多的数据,一个页面加载不完,需要分页加载,比如禅道的Bug数,一页默认是20个(自己可以根据需求更改),这时就有了第二页,第三页等等。

这时如果要获取所有的Bug标题来怎么做呢?

点击下一页Bug,你会发现url的变化,就只有最后一个数字改变,如下图:

大体思路:

获取所有url→ddt驱动获取每一页的数据

步骤:

第一步:获取所有url

这里已经显示了总共有几页和当前所在的页面数,我们要获取的就后面的数字 ‘3’。

先定位到这个元素,在通过正则取出后面的 ‘3’,具体代码如下:

b=self.driver.find_element_by_xpath(".//*[@id=\'bugList\']/tfoot/tr/td/div[2]/div/strong[2]")
page=re.findall(r\'/(.+?)\',b.text)
total_page=page[0]
print(\'总共的页数:\',total_page)

接下来就是要用到range函数了,获取所有的url地址了,代码如下:

for i in range(1,int(total_page)+1):
  Url=url+\'/zentao/bug-browse-1--unclosed-0--60-20-%s.html\' % i
  print(Url)

最后控制台输出如下:

观察下,是不是只有后面的1,2,3在跟着变,其他无任何变化,这时就可以将这些url添加到一个list中去,用做接下来的ddt驱动的数据了

具体代码如下:

#coding:utf-8
from selenium.webdriver.firefox.webdriver import WebDriver as Firefox
import re,time
from selenium.webdriver.support.ui import WebDriverWait
class GetUrl():
    \'\'\'获取所有URL页面\'\'\'
    def get_url(self,url,username,psw):
        self.driver=Firefox()
        self.driver.maximize_window()
        self.driver.set_page_load_timeout(20)
        self.driver.implicitly_wait(20)
        self.driver.get(url+\'/zentao/user-login-L3plbnRhby8=.html\') #输入网址
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_id("account")).send_keys(username) #输入账号
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_name("password")).send_keys(psw)   #输入密码
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_id(\'submit\')).click()              #点击登录按钮
        time.sleep(2)
        self.driver.find_element_by_xpath(".//*[@id=\'mainmenu\']/ul/li[4]/a").click()
        time.sleep(2)
        self.driver.find_element_by_xpath(".//*[@id=\'modulemenu\']/ul/li[2]/a").click()
        time.sleep(2)
        table=self.driver.find_element_by_id(\'bugList\')  #获取到bugList这个表格
        table_rows=table.find_elements_by_tag_name(\'tr\') #获取行数
        print((\'每一页数据的条数:\'),(len(table_rows)-2))    #这里减2是减去表格最上面和最下面那行
        b=self.driver.find_element_by_xpath(".//*[@id=\'bugList\']/tfoot/tr/td/div[2]/div/strong[2]") #定位到页面显示总页数那个元素(1/3)
        page=re.findall(r\'/(.+?)\',b.text)  #通过正则取出后面那个总页数(也就是那个3)
        total_page=page[0]
        print(\'总共的页数:\',total_page)
        a=[]  #创建空list去接收生成的url
        for i in range(1,int(total_page)+1):
            Url=url+\'/zentao/bug-browse-1--unclosed-0--60-20-%s.html\' % i
            a.append(Url)  
        print(a)
        self.driver.close()
        return a
if __name__==\'__main__\':
    url=\'http://127.0.0.1\'
    username=\'admin\'
    psw=\'123456\'
    a=GetUrl()
    a.get_url(url,username,psw)

 

 

第二步:编写另一个类来执行

1.导入第一步的url结果

 2.添加ddt驱动

3.将结果写入TXT中

具体代码如下:

#coding:utf-8
import unittest
import ddt
import time
from com.Practice.test_geturl import GetUrl
from selenium import webdriver
from selenium.webdriver.support.ui import WebDriverWait
url=\'http://127.0.0.1\'
username=\'admin\'
psw=\'123456\'
test_url=GetUrl().get_url(url,username,psw)
@ddt.ddt
class Test(unittest.TestCase):
    \'\'\'获取所有Bug标题\'\'\'
    @ddt.data(*test_url)
    def test_01(self,test_url):
        self.driver = webdriver.Firefox()
        self.driver.get(\'http://127.0.0.1/zentao/user-login-L3plbnRhby8=.html\')
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_id("account")).send_keys(\'admin\')
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_name("password")).send_keys(\'123456\')
        WebDriverWait(self.driver,20,1).until(lambda x:x.find_element_by_id(\'submit\')).click()
        time.sleep(1)
        self.driver.get(test_url)
        a=self.driver.find_elements_by_xpath(".//*[@id=\'bugList\']/tbody/tr/td[4]/a")
        for i in a:
            print(i.text)
            try:
                with open(\'zendao.txt\',\'a\') as f:
                    f.write(i.text+\'\n\')  
            except Exception as msg:
                print(\'写入时出错啦:%s\' % msg)     
        time.sleep(1)
    def tearDown(self):
        self.driver.close()

if __name__==\'__main__\':
    unittest.main()

这里获取文本信息是通过table定位获取。

最后TXT打印结果(没截全):

 

这个是一个优惠券生成的网址,也是分页显示,原理和上面大体相同。

结语:

 这个有点麻烦,应该还有更简单的方法。只可惜小白一枚,能力不足,暂时就只能先这样做了,欢迎大家提意见!!!

 

分类:

技术点:

相关文章: