【发布时间】:2022-06-11 00:19:28
【问题描述】:
第一次使用 python selenium 进行网络报废,这是我正在研究的html
<div class="Building-locate-sorting">
<strong>Building Number:</strong> 2828285<br>
<strong>Building Name:</strong> Staten<br>
<strong>Entry Date:</strong> 07/01/2019<br>
<strong>Exit Date:</strong> 06/30/2022<br>
<strong>DockingTerm Terms:</strong> 2 Eleveator,$50lat<br>
</div>
在我的代码中,我将代码提取为
location = driver.find_elements_by_xpath("//td[contains(@class,'Building-locate-sorting')]")
而我真正想要的是将值作为数据框/表格格式获取
BuildingNO|BuildingName|EntryDate|ExitDate 2828285|Staten |7/1/2019 | 6/30/2022
我被卡住了,因为我的所有输出都是一个长值,例如
( Building Number : 2828285 Building Name : Staten .....)
任何帮助我都非常感谢。 谢谢
【问题讨论】:
-
你试过pandas DataFrame是否有效?
-
pd.read_html 并没有真正返回任何东西..
标签: html python-3.x dataframe selenium