【发布时间】:2021-07-22 01:29:23
【问题描述】:
我正在使用 Selenium 和 BeautifulSoup 运行刮板,我想检查某个单词是否在
一个sn-p的HTML代码如下:
<div data-asin="0974158232" data-index="0" data-uuid="1f362f6b-dde2-4377-a5f3-518513486b7d" data-component-type="s-search-result" class="s-result-item s-asin sg-col-0-of-12 sg-col-16-of-20 sg-col sg-col-12-of-16" data-component-id="14" data-cel-widget="search_result_0"><div class="sg-col-inner">
<div data-asin="" data-index="1" class="a-section a-spacing-none s-result-item s-flex-full-width s-border-bottom-none s-widget" data-cel-widget="search_result_1">
<div data-asin="" data-index="2" class="a-section a-spacing-none s-result-item s-flex-full-width s-border-bottom-none s-widget" data-cel-widget="search_result_2">
首先,我想检查div data-asin="" 是否为空,或者是否存在data-asin="0974158232" 中的字符串。
如果它是空的,我想输入
data-asin。 div data-asin="" data-index="2" 的一个例子是:
> <div data-asin="" data-index="2" class="a-section a-spacing-none s-result-item s-flex-full-width s-border-bottom-none s-widget" data-cel-widget="search_result_2">
> <span cel_widget_id="MAIN-SEARCH_RESULTS-2" class="celwidget slot=MAIN template=SEARCH_RESULTS
widgetId=fkmr-search-results" data-csa-c-id="9so6vg-imque6-h59746-o5az71" data-cel-widget="MAIN-
SEARCH_RESULTS-2">
> <div class="s-result-list sg-row">
> <div class="s-result-item sg-col-16-of-20 sg-col sg-col-8-of-12 sg-col-12-of-16" data-cel-
widget="search_result_3">
> <div data-asin="0974158216" data-index="0" data-uuid="99a1b582-2fcb-49b8-8d13-739783e460a5"
data-component-type="s-search-result" class="s-result-item s-asin sg-col-0-of-12 sg-col-16-
of-20 sg-col sg-col-12-of-16" data-component-id="15" data-cel-widget="search_result_4"><div
class="sg-col-inner">
> <div data-asin="1433692163" data-index="1" data-uuid="8f8bfb8c-6083-4c26-bdd5-3032bcfe4bed"
data-component-type="s-search-result" class="s-result-item s-asin sg-col-0-of-12 sg-col-16-
of-20 sg-col sg-col-12-of-16" data-component-id="16" data-cel-widget="search_result_5">
在这里,我想告诉代码查找data-asin="" 并检查它是否为空字符串。在这种情况下,它不会为空,因为我们有:<div data-asin="0974158216" 和 <div data-asin="1433692163"
我在考虑使用 for 循环或 try/except,但我对 Selenium 和 HTML 很陌生,我不知道如何解决这个问题。任何形式的帮助将不胜感激。
【问题讨论】:
-
可以分享网址吗?可以用
beautifulsoup吗? -
@AndrejKese 当然,感谢您的回复!网址是link 我有进口美汤是的。从来没有用过很多,但能学到一些东西会很棒,所以请继续。
标签: python html css selenium web-scraping