Python3中如何解决中文乱码与编码的问题

1.解决乱码问题：

pyhton中内部所有编码是Unicode，中文是gbk；正常情况下，我们输出的是utf-8；

我们可以采用sys.getdefaultencoding()查看系统默认的编码；解决方法有如下几种：

1.在文件开头添加上：#coding:utf-8或者# -*- coding:utf-8 -*-

2.转换路径：原文件编码 ->unicode中转码 ->我们需要的编码格式 （decode()可选） ->unicode ->encode(),如果内容已经unicode，则不需要decode(),直接使用encode()

3.举例：

a.如果网页是utf-8,我们可使用html.read().decode('utf-8')能将网页在控制台打印；

b.如果网页是gb2312,则使用html.read().decode('gbk').encode(''utf-8)正常打印；（注意：decode('gbk')不能使用gbk2312,需用统一使用gbk）

4.判断指定的内容是什么编码：(注意：使用unicode只针对python2，python3已经取消了unicode函数，python3默认是utf8编码，Python 3中基本的str就是unicode，所以可以直接判断str： >>> isinstance('s', str) True)

if isinstance(content,unicode)：表示如果content编码为unicode则为True,否则False