【问题标题】:Unable to scrape name from google finance无法从谷歌金融中刮取姓名
【发布时间】:2017-06-02 08:31:09
【问题描述】:

我想抓取在谷歌财经上列出的公司的名称、网址和描述。到目前为止,我已成功获取描述和 url,但无法获取名称。在 myUrl 的源代码中,名称是 024 Pharma Inc。当我看到 div 时,该类名为“appbar-sn-p-primary”。但是代码仍然没有找到它。我是网络抓取的新手,所以我可能遗漏了一些东西。请在这方面指导我。

from bs4 import BeautifulSoup
import urllib
import csv

myUrl = 'https://www.google.com/finance?q=OTCMKTS%3AEEIG' 

r = urllib.urlopen(myUrl).read()
soup = BeautifulSoup(r, 'html.parser')

name_box = soup.find('div', class_='appbar-snippet-primary')  # !! This div is not found
#name = name_box.text  
#print name

description = soup.find('div', class_='companySummary') 
desc = description.text.strip()  
#print desc

website = soup.find('div', class_='item')  
site = website.text  
#print site 

【问题讨论】:

标签: python web-scraping


【解决方案1】:
from bs4 import BeautifulSoup
import requests

myUrl = 'https://www.google.com/finance?q=OTCMKTS%3AEEIG' 

r = requests.get(myUrl).content
soup = BeautifulSoup(r, 'html.parser')

name = soup.find('title').text.split(':')[0]  # !! This div is not found
#print name

description = soup.find('div', class_='companySummary') 
desc = description.text.strip()  
#print desc

website = soup.find('div', class_='item')  
site = website.text

【讨论】:

    【解决方案2】:

    用soup.find_all() 代替soup.find()

    【讨论】:

      猜你喜欢
      • 2015-11-06
      • 1970-01-01
      • 1970-01-01
      • 2018-01-27
      • 1970-01-01
      • 1970-01-01
      • 2017-11-28
      • 2011-08-03
      • 2010-11-21
      相关资源
      最近更新 更多