【问题标题】:How to extract value from href in python?如何从python中的href中提取值?
【发布时间】:2017-11-07 13:08:53
【问题描述】:
  1. 您好,开发人员。我在 python 中提取 href 值时遇到问题。
  2. 点击“查看答案”后,我有一个按钮,它带我进入下一个链接,我想提取该链接中存在的数据。

    <div class="col-md-11 col-xs-12">
    <a href="https://www.marham.pk/forum/thread/4471/i-need-a-good-orthopedic- dr">
    <div class="hover-div">
    <h2 itemprop="name">i need a good Orthopedic dr</h2>
    
    </div>
    </a>
    <div class="thread-details">
    <a href="https://www.marham.pk/forum/thread/4471/i-need-a-good-orthopedic-dr">
    <p class="pull-left"><span class="glyphicon glyphicon-comment"></span> View Answers (<span itemprop="answerCount">1</span>) </p>
            </a>
    </div>
    </div>
    
  3. 我需要提取这个 href 标签。

【问题讨论】:

    标签: python-3.x xpath web-crawler


    【解决方案1】:

    您可以在 Python 中使用数据抓取。 Beautiful Soup 是一个 Python 库,用于从 HTML 和 XML 文件中提取数据。

    将 bs4 导入为 bs

    导入 urllib.request

    sauce = urllib.request.urlopen("你的 URL 会在这里").read()

    soup = bs.BeautifulSoup(sauce,'html5lib')

    打印(汤)

    【讨论】:

    • 如果您不理解答案,请在下方评论。并澄清您的问题。无论您是要从 html 标记中提取该链接,还是要从该链接中提取数据。
    • 我想从那个 href 中提取数据
    • 那你必须使用 Python 的 BeatifulSoup 库。它将从给定的链接中提取数据。如果有任何帮助需要下面的评论。
    • 是的,我知道,但是怎么做??我想提取该href上的值意味着单击此链接后该地址上显示的值
    • 是的,我在帖子中做了一些更改。我添加了一些代码尝试一下
    猜你喜欢
    • 2013-07-14
    • 1970-01-01
    • 2023-03-05
    • 1970-01-01
    • 2021-10-21
    • 1970-01-01
    • 1970-01-01
    • 2020-06-18
    • 1970-01-01
    相关资源
    最近更新 更多