【发布时间】:2020-02-24 05:08:19
【问题描述】:
我正在尝试将 https://m.the-numbers.com/market/2018/top-grossing-movies ,特别是表格抓取到 CSV 中。我正在使用 Python 和 Beautiful Soup,但我对此很陌生,并且会喜欢任何解决方案的任何提示。有哪些简单的方法可以解决这个问题?
谢谢
这是我下面的最新实验......
from bs4 import BeautifulSoup
import requests
import csv
source = requests.get('https://m.the-numbers.com/market/2018/top-grossing-movies').text
soup = BeautifulSoup(source, 'lxml')
csv_file = open('cms_scrape.csv', 'w')
csv_writer = csv.writer(csv_file)
csv_writer.writerow(['filmTitle', 'releasDate', 'distributor', 'genre', 'gross', 'ticketsSold'])
for tbody in soup.find_all('a', class_='table-responsive'):
filmTitle = tbody.tr.td.b.a.text
print(filmTitle)
csv_writer.writerow([filmTitle])
csv_file.close()
【问题讨论】:
-
你能和我们分享你的剧本吗?
-
当然,这是我当前实验的中间阶段,我尝试了 4 或 5 种不同的方法,我觉得我只是误解了一些非常基本的东西,或者遗漏了一些简单的东西。现在附上它。
标签: python web-scraping beautifulsoup