【发布时间】:2011-02-07 07:07:50
【问题描述】:
我正在尝试使用特定 HTML 文件的以下代码
from BeautifulSoup import BeautifulSoup
import re
import codecs
import sys
f = open('test1.html')
html = f.read()
soup = BeautifulSoup(html)
body = soup.body.contents
para = soup.findAll('p')
print str(para).encode('utf-8')
我收到以下错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u2019' in position 9: ordinal not in range(128)
如何调试?
当我删除对打印功能的调用时,我没有收到任何错误。
【问题讨论】:
标签: python unicode beautifulsoup