【问题标题】:Python - Parse textPython - 解析文本
【发布时间】:2019-07-05 21:36:13
【问题描述】:

我有一个如下所示的 JSON 响应:

{"wynik":["\n\t\t<div class=\"col-lg-3 col-md-3 col-sm-6 mb50\">\n\t\t\t<div class=\"item\">\n\t\t\t<div class=\"movie-box-3 movie-box-search\">\n\t\t\t\t<div class=\"listing-container\">\n\t\t\t\t<a href=\"\/film2\/Anakondy.Polowanie.Na.Krwawa.Orchidee\" title=\"Anakondy: Polowanie na Krwaw\u0105 Orchide\u0119\">\n\n\t\t\t\t\t<!-- Movie List Image -->\n\t\t\t\t\t<div class=\"listing-image\">\n\t\t\t\t\t\t<!-- Image -->\n\t\t\t\t\t\t<img src=\"https:\/\/ssl-gfx.filmweb.pl\/po\/42\/50\/104250\/7128789.6.jpg\" alt=\"\" \/>\n\t\t\t\t\t\t<div class=\"movie-details-3\">\n\t\t\t\t\t\t\t<h2 class=\"title\">Anakondy: Polowanie na Krwaw\u0105 Orchide\u0119<\/h2>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<!-- Movie List Content -->\n\t\t\t\t\t<div class=\"listing-content\">\n\t\t\t\t\t\t<div class=\"inner text-center\">\n\t\t\t\t\t\t\t\n\t\t\t\t\t\t\tHorror, Przygodowy\n\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t<!-- Rating -->

如何在 python 中将其解析为普通的 html 以在现场进行解析?:

<div class="col-lg-3 col-md-3 col-sm-6 mb50">
            <div class="item">
            <div class="movie-box-3 movie-box-search">
                <div class="listing-container">
                <a href="/film2/Anakondy.Polowanie.Na.Krwawa.Orchidee" title="Anakondy: Polowanie na Krwawą Orchideę">

                    <!-- Movie List Image -->
                    <div class="listing-image">
                        <!-- Image -->
                        <img src="https://ssl-gfx.filmweb.pl/po/42/50/104250/7128789.6.jpg" alt="" class=" b-error">
                        <div class="movie-details-3">
                            <h2 class="title">Anakondy: Polowanie na Krwawą Orchideę</h2>
                        </div>
                    </div>

                    <!-- Movie List Content -->
                    </a><div class="listing-content"><a href="/film2/Anakondy.Polowanie.Na.Krwawa.Orchidee" title="Anakondy: Polowanie na Krwawą Orchideę">
                        </a><div class="inner text-center"><a href="/film2/Anakondy.Polowanie.Na.Krwawa.Orchidee" title="Anakondy: Polowanie na Krwawą Orchideę">

                            Horror, Przygodowy

【问题讨论】:

  • 你如何使用这些数据?它的一些内容(如 \n、\t)会被自动处理(解析),而其他内容可能无论如何都无关紧要
  • 我可以知道您为什么要按照您提到的方式解析 HTML 数据吗?
  • 感谢您的回答。我想让解析器从网站获取标题和视频链接。我有要解析的代码,但仅适用于主页(仅从类别加载 12 个视频),因为对于更多视频,我需要单击“Pokaż więcej”,这是问题所在。在另一篇文章中,一个人写信让我使用该 api,所以我尝试 ;) 这里是站点:filmy.plus/kategoria/Horror,这里是 API:filmy.plus/…
  • 这是我的 12 个视频的工作代码。我需要从类别的所有视频中获取名称,而不仅仅是 12url = 'https://filmy.plus/kategoria/Horror' response = get(url) #print(response.text[:6000]) html_soup = BeautifulSoup(response.text, 'lxml') type(html_soup) movie_containers = html_soup.find_all('div', class_ = 'movie-box-3 movie-box-search') print(url, "\nLiczba Filmów: ", len(movie_containers),"\n") for i in range(0,len(movie_containers)): first_movie = movie_containers[i] print(first_movie.a.h2.text) print('https://filmy.plus'+first_movie.a['href']+'\n')
  • 您可以控制 API 吗?如果没有,您可能需要use it like a DOM element

标签: python jquery parsing


【解决方案1】:

好吧,换一种方式)

just use print

【讨论】:

    猜你喜欢
    • 2017-07-15
    • 2012-08-09
    • 2012-09-16
    • 1970-01-01
    • 2012-02-05
    • 2015-09-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多