【发布时间】:2019-10-07 14:39:43
【问题描述】:
我正在尝试从该网站https://www.programmableweb.com/apis/directory 抓取每个 API 和类别的名称 并以这种格式打印出来
名称:谷歌地图
类别:映射
由于某种原因,我的代码只打印第一行。
我的代码
from bs4 import BeautifulSoup as bs
import requests
url = 'https://www.programmableweb.com/apis/directory'
response = requests.get(url)
data = response.text
soup = bs(data, 'html.parser')
info = soup.find_all('table',{'class':'views-table cols-4 table'})
for i in info:
name = soup.find('td',{'class':'views-field views-field-title col-md-3'}).text
category = soup.find('td',{'class':'views-field views-field-field-article-primary-category'}).text
print('name:',name, '\nCategory:', category)
如果你能进一步帮助我,我想做的是:
- API 名称
- API 网址
- API 类别
- 点击链接时的API描述
- 抓取下一页直到没有剩余页面
- 使用pandas将其做成DataFrame,然后放入csv文件中
【问题讨论】:
标签: python-3.x web-scraping beautifulsoup