superhin

CSV(Comma-Separated Values)即逗号分隔值,一种以逗号分隔按行存储的文本文件,所有的值都表现为字符串类型(注意:数字为字符串类型)。

如果CSV中有中文,应以utf-8编码读写,如果要支持Excel查看,应是要用utf-8 with bom格式及utf-8-sig

Python3操作CSV文件使用自带的csv包

  • reader=csv.reader(f, delimiter=\',\'):用来读取数据,reader为生成器,每次读取一行,每行数据为列表格式,可以通过delimiter参数指定分隔符
  • writer=csv.writer(f):用来写入数据,按行写入,writer支持writerow(列表)单行写入,和writerows(嵌套列表)批量写入多行,无须手动保存。

当文件中有标题行时,可以使用header=next(reader)先获取到第一行的数据,再进行遍历所有的数据行。
写入时,可以先使用writer.writerow(标题行列表),写入标题行,再使用writer.writerows(多行数据嵌套列表),写入多行数据(也可以逐行写入)。

数据文件data.csv:

name,password
abc,123456
张五,123#456
张#abc123,123456
666,123456
a b,123456

读取示例:

import csv

with open(\'data.csv\', encoding=\'utf-8\') as f:
    reader = csv.reader(f)
    header = next(reader)
    print(header)
    for row in reader:
        print(row)

注意:reader必须在文件打开的上下文中使用,否则文件被关闭后reader无法使用
所有的数字被作为字符串,如果要使用数字格式,应使用int()/float()做相应转换

写入示例:

import csv

header = [\'name\', \'password\', \'status\']

data = [
    [\'abc\', \'123456\', \'PASS\'],
    [\'张五\', \'123#456\', \'PASS\'],
    [\'张#abc123\', \'123456\', \'PASS\'],
    [\'666\', \'123456\', \'PASS\'],
    [\'a b\', \'123456\', \'PASS\']
]


with open(\'result.csv\', \'w\', encoding=\'utf-8\', newline=\'\') as f:
    writer = csv.writer(f)
    writer.writerow(header)
    writer.writerows(data)

注意,打开文件时应指定格式为w, 文本写入,不支持wb,二进制写入,当然,也可以使用a/w+/r+
打开文件时,指定不自动添加新行newline=\'\',否则每写入一行就或多一个空行。
如果想写入的文件Excel打开没有乱码,utf-8可以改为utf-8-sig。

结果展示,result.csv内容::

name,password,status
abc,123456,PASS
张五,123#456,PASS
张#abc123,123456,PASS
666,123456,PASS
a b,123456,PASS

使用字典格式的数据:DictReader, DictWriter

注意数据必须有标题行时才能使用

  • reader=csv.DictReader(f):直接将标题和每一列数据组装成有序字典(OrderedDict)格式,无须再单独读取标题行
  • writer=csv.DictWriter(f, 标题行列表):写入时可使用writer.writeheader()写入标题,然后使用writer.writerow(字典格式数据行)或write.writerows(多行数据)

读取示例:

import csv

with open(\'data.csv\', encoding=\'utf-8\') as f:
    reader = csv.DictReader(f)
    for row in reader:
        print(row[\'name\'], row[\'password\'])

写入示例:

import csv

header = [\'name\', \'password\', \'status\']

data = [
    {\'name\':\'abc\', \'password\':\'123456\', \'status\':\'PASS\'},
    {\'name\':\'张五\', \'password\':\'123#456\', \'status\':\'PASS\'},
    {\'name\':\'张#abc123\', \'password\':\'123456\', \'status\':\'PASS\'},
    {\'name\':\'666\', \'password\':\'123456\', \'status\':\'PASS\'},
    {\'name\':\'a b\', \'password\':\'123456\', \'status\':\'PASS\'}
]


with open(\'result2.csv\', \'w\', encoding=\'utf-8\', newline=\'\') as f:
    writer = csv.DictWriter(f, header)
    writer.writeheader()
    writer.writerows(data)

写入结果,同result.csv

参考链接:https://python3-cookbook.readthedocs.io/zh_CN/latest/c06/p01_read_write_csv_data.html

分类:

技术点:

相关文章: