【发布时间】:2017-03-13 16:37:32
【问题描述】:
当我尝试解析本地存储的网页副本时,beautifulsoup 向我返回乱码。我不明白为什么我在将 requests 和 bs4 模块一起用于抓取任务时从未遇到过这个问题。
这是我的代码
import requests
from bs4 import BeautifulSoup as BS
import os
url_2 = r'/Users/davidferreira/Documents/coding_2/ak_screen_scraping/bmra/'
os.chdir(url_2)
f = open('re_2.html')
soup = BS(url_2, "lxml")
f.close()
print soup
此代码返回以下内容:
<html><body><p>/Users/davidferreira/Documents/coding_2/ak_screen_scraping/bmra/</p></body></html>
我在网上找不到类似的问题,所以我在这里发布了。任何帮助将非常感激。
【问题讨论】:
标签: python beautifulsoup