Python - 解析文本答案

【问题标题】：Python - Parse textPython - 解析文本
【发布时间】：2019-07-05 21:36:13
【问题描述】：

我有一个如下所示的 JSON 响应：

{"wynik":["\n\t\t<div class=\"col-lg-3 col-md-3 col-sm-6 mb50\">\n\t\t\t<div class=\"item\">\n\t\t\t<div class=\"movie-box-3 movie-box-search\">\n\t\t\t\t<div class=\"listing-container\">\n\t\t\t\t<a href=\"\/film2\/Anakondy.Polowanie.Na.Krwawa.Orchidee\" title=\"Anakondy: Polowanie na Krwaw\u0105 Orchide\u0119\">\n\n\t\t\t\t\t<!-- Movie List Image -->\n\t\t\t\t\t<div class=\"listing-image\">\n\t\t\t\t\t\t<!-- Image -->\n\t\t\t\t\t\t<img src=\"https:\/\/ssl-gfx.filmweb.pl\/po\/42\/50\/104250\/7128789.6.jpg\" alt=\"\" \/>\n\t\t\t\t\t\t<div class=\"movie-details-3\">\n\t\t\t\t\t\t\t<h2 class=\"title\">Anakondy: Polowanie na Krwaw\u0105 Orchide\u0119<\/h2>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<!-- Movie List Content -->\n\t\t\t\t\t<div class=\"listing-content\">\n\t\t\t\t\t\t<div class=\"inner text-center\">\n\t\t\t\t\t\t\t\n\t\t\t\t\t\t\tHorror, Przygodowy\n\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t<!-- Rating -->

如何在 python 中将其解析为普通的 html 以在现场进行解析？：

<div class="col-lg-3 col-md-3 col-sm-6 mb50">
            <div class="item">
            <div class="movie-box-3 movie-box-search">
                <div class="listing-container">
                <a href="/film2/Anakondy.Polowanie.Na.Krwawa.Orchidee" title="Anakondy: Polowanie na Krwawą Orchideę">

                    <!-- Movie List Image -->
                    <div class="listing-image">
                        <!-- Image -->
                        <img src="https://ssl-gfx.filmweb.pl/po/42/50/104250/7128789.6.jpg" alt="" class=" b-error">
                        <div class="movie-details-3">
                            <h2 class="title">Anakondy: Polowanie na Krwawą Orchideę</h2>
                        </div>
                    </div>

                    <!-- Movie List Content -->
                    </a><div class="listing-content"><a href="/film2/Anakondy.Polowanie.Na.Krwawa.Orchidee" title="Anakondy: Polowanie na Krwawą Orchideę">
                        </a><div class="inner text-center"><a href="/film2/Anakondy.Polowanie.Na.Krwawa.Orchidee" title="Anakondy: Polowanie na Krwawą Orchideę">

                            Horror, Przygodowy

【问题讨论】：

你如何使用这些数据？它的一些内容（如 \n、\t）会被自动处理（解析），而其他内容可能无论如何都无关紧要
我可以知道您为什么要按照您提到的方式解析 HTML 数据吗？
感谢您的回答。我想让解析器从网站获取标题和视频链接。我有要解析的代码，但仅适用于主页（仅从类别加载 12 个视频），因为对于更多视频，我需要单击“Pokaż więcej”，这是问题所在。在另一篇文章中，一个人写信让我使用该 api，所以我尝试 ;) 这里是站点：filmy.plus/kategoria/Horror，这里是 API：filmy.plus/…
这是我的 12 个视频的工作代码。我需要从类别的所有视频中获取名称，而不仅仅是 12url = 'https://filmy.plus/kategoria/Horror' response = get(url) #print(response.text[:6000]) html_soup = BeautifulSoup(response.text, 'lxml') type(html_soup) movie_containers = html_soup.find_all('div', class_ = 'movie-box-3 movie-box-search') print(url, "\nLiczba Filmów: ", len(movie_containers),"\n") for i in range(0,len(movie_containers)): first_movie = movie_containers[i] print(first_movie.a.h2.text) print('https://filmy.plus'+first_movie.a['href']+'\n')
您可以控制 API 吗？如果没有，您可能需要use it like a DOM element