【发布时间】:2018-07-24 22:48:18
【问题描述】:
我正在尝试使用 Python 将评论的详细信息从 here 抓取到 CSV 中。每部电影都有一个星级评分,由一张图片表示,有一个类('icon-star-fill' 或 'icon-star-half')。我正在尝试编写一个函数来分配一个数值。
我目前的代码是返回一个 bs4.element.ResultSet,每个元素都有一个标签
[<i class="icon-star-full"></i>, <i class="icon-star-full"></i>]
我想把它转换成一个字符串列表,比如
["<i class="icon-star-full"></i>", "<i class="icon-star-full"></i>"]
我尝试了 soup_obj.text、soup_obj.content,但它们返回的是空字符串。
这是我的代码
from bs4 import BeautifulSoup
import requests
result = requests.get(url='http://www.rogerebert.com/reviews')
result_content = result.content
soup_obj = BeautifulSoup(result_content, 'html5lib')
wrapper_class = soup_obj.find('div', id='review-list')
for x in wrapper_class.find_all('figure'):
convoluted_rating = x.find('span', class_='star-rating').find_all('i')
print convoluted_rating
我见过this,它返回一个没有的数组,就像这样
[None,None]
【问题讨论】:
标签: python web-scraping beautifulsoup