【发布时间】:2019-07-05 21:36:13
【问题描述】:
我有一个如下所示的 JSON 响应:
{"wynik":["\n\t\t<div class=\"col-lg-3 col-md-3 col-sm-6 mb50\">\n\t\t\t<div class=\"item\">\n\t\t\t<div class=\"movie-box-3 movie-box-search\">\n\t\t\t\t<div class=\"listing-container\">\n\t\t\t\t<a href=\"\/film2\/Anakondy.Polowanie.Na.Krwawa.Orchidee\" title=\"Anakondy: Polowanie na Krwaw\u0105 Orchide\u0119\">\n\n\t\t\t\t\t<!-- Movie List Image -->\n\t\t\t\t\t<div class=\"listing-image\">\n\t\t\t\t\t\t<!-- Image -->\n\t\t\t\t\t\t<img src=\"https:\/\/ssl-gfx.filmweb.pl\/po\/42\/50\/104250\/7128789.6.jpg\" alt=\"\" \/>\n\t\t\t\t\t\t<div class=\"movie-details-3\">\n\t\t\t\t\t\t\t<h2 class=\"title\">Anakondy: Polowanie na Krwaw\u0105 Orchide\u0119<\/h2>\n\t\t\t\t\t\t<\/div>\n\t\t\t\t\t<\/div>\n\n\t\t\t\t\t<!-- Movie List Content -->\n\t\t\t\t\t<div class=\"listing-content\">\n\t\t\t\t\t\t<div class=\"inner text-center\">\n\t\t\t\t\t\t\t\n\t\t\t\t\t\t\tHorror, Przygodowy\n\t\t\t\t\t\t\t\n\t\t\t\t\t\t\t<!-- Rating -->
如何在 python 中将其解析为普通的 html 以在现场进行解析?:
<div class="col-lg-3 col-md-3 col-sm-6 mb50">
<div class="item">
<div class="movie-box-3 movie-box-search">
<div class="listing-container">
<a href="/film2/Anakondy.Polowanie.Na.Krwawa.Orchidee" title="Anakondy: Polowanie na Krwawą Orchideę">
<!-- Movie List Image -->
<div class="listing-image">
<!-- Image -->
<img src="https://ssl-gfx.filmweb.pl/po/42/50/104250/7128789.6.jpg" alt="" class=" b-error">
<div class="movie-details-3">
<h2 class="title">Anakondy: Polowanie na Krwawą Orchideę</h2>
</div>
</div>
<!-- Movie List Content -->
</a><div class="listing-content"><a href="/film2/Anakondy.Polowanie.Na.Krwawa.Orchidee" title="Anakondy: Polowanie na Krwawą Orchideę">
</a><div class="inner text-center"><a href="/film2/Anakondy.Polowanie.Na.Krwawa.Orchidee" title="Anakondy: Polowanie na Krwawą Orchideę">
Horror, Przygodowy
【问题讨论】:
-
你如何使用这些数据?它的一些内容(如 \n、\t)会被自动处理(解析),而其他内容可能无论如何都无关紧要
-
我可以知道您为什么要按照您提到的方式解析 HTML 数据吗?
-
感谢您的回答。我想让解析器从网站获取标题和视频链接。我有要解析的代码,但仅适用于主页(仅从类别加载 12 个视频),因为对于更多视频,我需要单击“Pokaż więcej”,这是问题所在。在另一篇文章中,一个人写信让我使用该 api,所以我尝试 ;) 这里是站点:filmy.plus/kategoria/Horror,这里是 API:filmy.plus/…
-
这是我的 12 个视频的工作代码。我需要从类别的所有视频中获取名称,而不仅仅是 12
url = 'https://filmy.plus/kategoria/Horror' response = get(url) #print(response.text[:6000]) html_soup = BeautifulSoup(response.text, 'lxml') type(html_soup) movie_containers = html_soup.find_all('div', class_ = 'movie-box-3 movie-box-search') print(url, "\nLiczba Filmów: ", len(movie_containers),"\n") for i in range(0,len(movie_containers)): first_movie = movie_containers[i] print(first_movie.a.h2.text) print('https://filmy.plus'+first_movie.a['href']+'\n') -
您可以控制 API 吗?如果没有,您可能需要use it like a DOM element