字符编码与文件

字符编码

因为计算机内只识别二进制,但是用户使用计算的时候可以看到各式各样的语言文符,字符编码就是人类字符与数字对应关系的数据

字符代码发展

由于计算机是由美国人发明的,所以刚开始只有一些字母、数字、符号被编进计算机内,用一个字节对应关系,被称为ASCII码。由于计算机的普及,各个国家开始研究自己的编码表。

例如中国的GB2312码,日本的shift_JIS码,韩国的Euc_kr码

中国GB2312编码表

为了各个国家之间的文本数据可以无障碍交流需要编码统一,则出现了万国码

unicode(万国码)

统一使用两个及以上字符记录字符与数字的对应关系

utf8(inicode的优化版)

英文一个字符储存,中文使用三个或以上储存

文件乱码

文件用什么编码编的,就用什么编码解

python解释器版本不同带来的编码差异

python2.x内部使用的编码默认是ASCII

可以使用文件头把ASCII转换成utf8

可以自定义文件模板内容把文件头加到文件中

编码与解码

编码就是将人类看的懂的字符按照指定的编码转换成数字

解码就是将数字按照指定的编码转换成人类看得懂的字符

文件操作

文件就是操作系统暴露给用户操作硬盘的快捷方式(接口)

代码操作文件 open

open(文件路径,读写模式,字符编码)字符编码不是必须的(有些模式需要字符编码)

with上下文管理(自动close)

文件读写模式

r 只读模式（只能看，不能写）

文件路径不存在报错

写内容就报错

w 只写模式(只能写,不能看)

文件路径不存在就创建一个

先清除内容,再写入

a 只追加内容(只追加内容)

文件路径不存在就创建一个

ps: r w a 都只能操纵文本文件

文件操作方法

读系列

写系列

文件优化操作

文本操作模式

t 文本模式

1.默认的模式

r w a = rt wt at

2.该模式操作基本单位都是以字符串为基本单位(文本)

3.该模式必须指定encoding参数

4.该模式只能操作文本文件

b 二进制模式

rb wb ab

1.该模式可以操作任意类型的文件

2.该模式所有操作都是以bytes类型(二进制)基本单位

二进制读写模式操作

文件内光标的移动

文件内内容修改

覆盖

一次性读完整个文件,文件过大占内存多

新建

同一时间有两块地方存着相同的内容

没啦

相关文章：

2021-10-14
2022-12-23
2022-12-23
2022-12-23
2021-08-13
2021-11-14
2021-07-28
2021-04-15

猜你喜欢

2022-01-05
2021-11-30
2021-08-17
2022-02-18
2021-07-25

相关资源

下载 2022-12-12
下载 2021-06-24
下载 2022-12-23
下载 2023-02-23

相似解决方案

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode