【问题标题】:Get selected text from web elements从 web 元素中获取选定的文本
【发布时间】:2021-08-24 09:37:03
【问题描述】:

是否有可能从 td 标签中获取纯文本的第一个文本,例如“Zubr Polish Lager 6%”

<td width="35%">Amber Storm Scotch Ale 6% 
                    <br/>SIZE/LIFE: 330ml <b>CASE</b>
                    <br/>UOS: 12
                    <br/>RRP: £1.59
                    <br/>POR%: 100.1%
                    </td>

【问题讨论】:

    标签: python html selenium dom css-selectors


    【解决方案1】:

    像这样在你的 td 元素中给出 id

    <td width="35%"><div id="myId">Amber Storm Scotch Ale 6% </div>
                        <br/>SIZE/LIFE: 330ml <b>CASE</b>
                        <br/>UOS: 12
                        <br/>RRP: £1.59
                        <br/>POR%: 100.1%
                        </td>
    

    然后你就可以调用你的id

    【讨论】:

      【解决方案2】:

      比使用&lt;/br&gt;更好你可以使用一些&lt;p&gt; like

      <td width="35%">
         <p>Amber Storm Scotch Ale 6% </p>
         <p>SIZE/LIFE: 330ml <b>CASE</b></p>
         <p>UOS: 12 </p>
         <p>RRP: £1.59 </p>
         <p>POR%: 1B00.1% </p>
      </td>
      

      在 JS 之后你可以使用 firstElementChild.innerHtml 来获取第一个 p 元素的内容。

      但为此,您需要向您的 &lt;td&gt; 添加一个 ID。

      【讨论】:

        【解决方案3】:

        如果您是网络抓取,请使用 BeautifulSoup 获取文本 HTML。

        !pip install beautifulsoup4
        from bs4 import BeautifulSoup
        html = """
        <td width="35%">Amber Storm Scotch Ale 6% 
                            <br/>SIZE/LIFE: 330ml <b>CASE</b>
                            <br/>UOS: 12
                            <br/>RRP: £1.59
                            <br/>POR%: 100.1%
                            </td>
        """
        BeautifulSoup(html).find('td').text.split('\n')[0]
        
        Output: 'Amber Storm Scotch Ale 6% '
        

        【讨论】:

        • @AhsanNasir 其他答案更多关于 HTML。下次写你正在网络报废,因为问题中没有提到它,所以响应者必须猜测。我会感谢您接受答案。
        • hlo 尝试过,但它给出了所有字符串
        猜你喜欢
        • 2011-11-05
        • 2020-04-21
        • 2021-03-25
        • 2016-12-12
        • 1970-01-01
        • 2012-10-27
        • 2011-01-23
        • 2011-08-06
        相关资源
        最近更新 更多