【发布时间】:2019-09-17 08:21:48
【问题描述】:
我对所有编程内容都很陌生,我正在为我的社会工程项目学习 Python。真的很抱歉,如果你会撞到自己的额头。
所以现在我正在看一个从某个 instagram 页面中抓取某些信息的教程。让我们说 f.e.我想从 www.instagram.com/nbamemes 提取信息
我在第 12 行“IndentationError: expected an indented block”中遇到问题。所以我已经用谷歌搜索了,但我只是没有得到代码。我需要放置自己的信息的占位符在哪里。
import requests
import urllib.request
import urllib.parse
import urllib.error
from bs4 import BeautifulSoup
import ssl
import json
class insta_Scraper_v1:
def getinfo(self, url):
html = urllib.request.urlopen('www.instagram.com/nbamemes', context=self.ctx).read()
soup = BeautifulSoup(html, 'html.parser')
data = soup.find_all('meta', attr={'property': 'og:description'})
text = data[0]
user = '%s %s %s' % (text[-3], text[-2], text[-1])
followers = text[0]
following = text[2]
posts = text[4]
print('User:', user)
print('Followers:', followers)
print('Following:', following)
print('Posts:', posts)
print('-----------------------')
def mail(self):
self.ctx = ssl.create_default_context()
self.ctx.check_hostname = False
self.ctx.verify_mode = ssl.CERT_NONE
with open('123.txt') as f:
self.content = f.readlines()
self.content = [x.strip() for x in self.content]
for url in self.content:
self.getinfo(url)
if __name__ == '__main__'
obj = insta_Scraper_v1()
obj.mail()
我使用了一个教程来进行编程。但是,我没有完全正确。它对初学者并不完全友好,我似乎需要帮助。再次为这个超级初学者的问题感到抱歉。
问候,
等级
【问题讨论】:
-
你从哪里复制的?缩进在python中很重要
-
代码中有太多错误。我修复了它们,但我认为你需要先从 python 的基础开始。
-
大家好,感谢您的回复和帮助。我用这个来:promptcloud.com/blog/how-to-scrape-instagram-data-using-python
标签: python beautifulsoup instagram screen-scraping urllib