【发布时间】:2014-08-04 01:40:00
【问题描述】:
尝试编写一个简单的脚本来给我一个表格的所有单元格内容。
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
url = 'http://127.0.0.1/html5css3'
driver = webdriver.Firefox()
driver.get(url)
table = driver.find_elements_by_xpath("//td//text()")
for t in table:
print t
我还没有找到涵盖从基础到高级的 xpath 语法教程。
示例输入:
<table border="1">
<tr>
<td>Product</td>
<td>Vehicle</td>
<td>Price</td>
<td>Rating</td>
</tr>
<tr>
<td>Duration</td>
<td>Latex</td>
<td>62</td>
<td>5</td>
</tr>
<tr>
<td>Super Paint</td>
<td>Latex</td>
<td>56</td>
<td>4</td>
</tr>
<tr>
<td>A-100</td>
<td>Latex</td>
<td>48</td>
<td>3</td>
</tr>
<tr>
<td>Macropoxy</td>
<td>Epoxy</td>
<td>62</td>
<td>5</td>
</tr>
</table>
【问题讨论】:
-
我的最终目标是做类似 PRINT td[2] where td[4] is greater than 3
-
你能告诉我们变量表的内容吗?它是什么类型的?
-
您希望
type(table[0]) == WebElement还是type(table[0])==str? -
使用
requests和xml.etree.elementtree可以更轻松地处理您给出的示例。除非您确信自己需要 selenium 的浏览器自动化功能,否则最好使用这些接口。