【发布时间】:2017-09-13 23:45:11
【问题描述】:
我使用 Heroku 来托管我的电报机器人。 该机器人的目的是从网页中检索 html 并将其转换为 pdf。
成功在线托管后,我尝试向机器人发送 URL,但它在发送获取请求时冻结/停止。
代码:
logger.info('retrieving HTML = {}'.format(url))
page_html = requests.get(url)
logger.info('retrieved HTML')
logger.info('started HTML parsing')
soup = BeautifulSoup(page_html.text, 'html.parser')
在 Heroku 日志中,我只看到 retrieving HTML = <URL>,而应用程序没有显示任何活动迹象。
我尝试使用 heroku 控制台(可从 heroku 网页访问)连接到 dyno(heroku 上的应用程序本身),并输入以下代码:
import requests
# url of a recepie
url = 'https://pikabu.ru/story/pirog_quotlen__matushkaquot_5332461'
html = requests.get(url)
在 heroku 控制台中执行此代码也需要很长时间并且没有完成(没有错误,没有消息,我可以使用 crtl+c 停止进程,执行永远不会完成),我不确定是什么可能是问题所在。
提前感谢您,任何提示或帮助将不胜感激。
【问题讨论】:
-
@bhansa 是的,我可以打开它。只需在开头添加
https://
标签: python heroku https python-requests