【问题标题】:Need text between each br tag需要每个 br 标签之间的文本
【发布时间】:2019-11-27 09:25:10
【问题描述】:
driver.get('https://cogos.com/locations')
y = driver.find_elements(By.XPATH, "//*[@class= 'address']")

for a in y:
    b = a.text
    print(b)

返回:

CoGo’s 450 BP
1610 Gringo Road
Aliquippa
663.07 Miles.
CoGo’s 497 BP
2399 Duss Avenue
Ambridge
666.93 Miles.
CoGo’s 463 BP
1907 Darlington Road
Beaver Falls
668.64 Miles.
CoGo’s 30 Sunoco
6371 Lincoln Highway
Bedford
719.65 Miles.
CoGo’s 809 Exxon
5100 State Route 51
Belle Vernon
667.74 Miles.

【问题讨论】:

  • 您可以提取全部文本的所有 4 部分,如 CoGo’s 450 BP1610 Gringo RoadAliquippa663.07 Miles。你期待别的吗?
  • @DebanjanB 我需要将每一行添加到 csv 文件的单独行中。
  • 你能提供一个例子来说明你的 csv 文件应该是什么样子吗?

标签: python selenium web-scraping


【解决方案1】:

作为一个选项,我在这里推荐: 以您的方式提取: 通过 Xpath 进行提取:

//*[@class= 'address']/p

并且对于提取的每一段文本 - 由换行符分割。

this one -

inputString.splitlines()

应该做的伎俩;

在你的情况下

driver.get('https://cogos.com/locations')
y = driver.find_elements(By.XPATH, "//*[@class= 'address']/p")

for a in y:
    b = a.text
    x = b.splitlines()
    print(x)

希望这对您有所帮助。 问候,

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2021-07-28
    • 1970-01-01
    • 2014-11-18
    • 1970-01-01
    • 2022-11-19
    • 1970-01-01
    • 2015-03-05
    • 2021-07-01
    相关资源
    最近更新 更多