【发布时间】:2019-10-17 22:52:05
【问题描述】:
我正在尝试抓取此website 并尝试获取评论,但我遇到了一个问题,
- 该页面仅加载 50 条评论。
- 要加载更多,您必须单击“显示更多评论”,我不知道如何获取所有数据,因为没有页面链接,“显示更多评论”也没有可供探索的 URL,地址保持不变。
网址 = "https://www.capterra.com/p/134048/HiMama-Preschool-Child-Care-App/#reviews"
import requests
from bs4 import BeautifulSoup
import json
import pandas as pd
a = []
url = requests.get(url)
html = url.text
soup = BeautifulSoup(html, "html.parser")
table = soup.findAll("div", {"class":"review-comments"})
#print(table)
for x in table:
a.append(x.text)
df = pd.DataFrame(a)
df.to_csv("review.csv", sep='\t')
我知道这不是漂亮的代码,但我只是想先获取评论文本。 请帮助。因为我对此并不陌生。
【问题讨论】:
标签: python python-3.x beautifulsoup request