wztshine

参考自:https://www.cnblogs.com/alex3714/articles/5717620.html

 

1. 文件基础操作

f = open(\'test.txt\') #打开文件
first_line = f.readline()       # 每次读一行,并移动文件指针
print(\'first line:\',first_line) #读一行
print(\'分隔线\'.center(50,\'-\'))
data = f.read()  # 读取剩下的所有内容,会一次性读取到内存,可能导致内存溢出
print(data)     #打印文件内容
 
f.close() #关闭文件

2. with open 语句

上面的文件操作需要手动关闭文件:f.close(),为了避免打开文件后忘记关闭,可以通过管理上下文,当with代码块执行完毕时,内部会自动关闭并释放文件资源,例如:

with open(\'test.txt\',\'r\',encoding=\'utf-8\') as f:
    print(f.readline())

在Python 2.7 后,with又支持同时对多个文件的上下文进行管理,即:

with open(\'log1\') as obj1, open(\'log2\') as obj2:
    pass

3. 打开文件的方式

打开文件的模式有:

  • r, 只读模式(默认)。
  • w,只写模式。【不可读;不存在则创建;存在则删除内容;】
  • a,追加模式。【可读;   不存在则创建;存在则只追加内容;】

"+" 表示可以同时读写某个文件

  • r+,可读写文件。【可读;可写(作为追加模式);可追加】
  • w+,写读【先写入,后读取,如果存在文件,先覆盖写入,在读取,没啥用】
  • a+,追加写入读取,默认文件指针处在文件的末尾,如果要读取,需要先f.seek(0),而无论文件指针处在什么位置,只要写入,就追加写在文件末尾

"U"表示在读取时,可以将 \r \n \r\n自动转换成 \n (与 r 或 r+ 模式同使用)

  • rU
  • r+U

"b"表示处理二进制文件(如:图片、视频、音频,FTP发送上传ISO镜像文件,linux可忽略,windows处理二进制文件时需标注)

  • rb
  • wb
  • ab

4. 常用方法

with open(\'text.txt\',\'r+\',encoding=\'utf-8\') as f:
    content = f.read() # 一次性读取文件所有内容,如果文件过大,可能内存溢出
    f.readlines()  # 一次性读取所有文件的行,生成一个列表,效率低
    f.readline()   # 读取文件的一行,效率高
    f.tell()       # 获取文件的指针所在字节位置
    f.seek()       # 移动文件的指针
    f.truncate(8)  # 截取文件前8个字节
    for line in f: # 循环读取文件的行,效率高
        print(line)
f.write(\'new message\') # 写入文件
f.flush() # 刷新缓存,直接将文件写入

 

2. shutil模块

import shutil

f1 = open(\'a.txt\',\'r\')
f2 = open(\'b.txt\',\'w\')

# shutil.copyfileobj(fsrc, fdst[, length])  把fsrc复制到一个新文件fdst里,length代表每次读取的大小,防止内存溢出
shutil.copyfileobj(f1,f2,1024)

# copy(src, dst, *, follow_symlinks=True)复制一个文件的路径,到另一个路径(可以为路径或者文件名),follow_symlinks在linux生效,具体搜索硬连接和软连接
shutil.copy(\'a.txt\',\'../b.txt\')

# chown(path, user=None, group=None) 改变给定path的所有者和组权限,似乎在linux生效
# shutil.chown()

# copy2(src, dst, *, follow_symlinks=True) 复制数据和数据的状态信息
shutil.copy2(\'a.txt\',\'../b.txt\')

# copymode(src, dst, *, follow_symlinks=True) 仅拷贝权限。内容、组、用户均不变
shutil.copymode()

# copystat(src, dst, *, follow_symlinks=True) 拷贝状态的信息,包括:mode bits, atime, mtime, flags
shutil.copystat()

# copytree(src, dst, symlinks=False, ignore=None, copy_function=copy2,
#              ignore_dangling_symlinks=False) 复制一个文件夹及其内容到另一个文件夹下,ignore过滤条件,可以多个
# 注意,必须要指定一个文件夹,即把a文件夹的内容,复制到父目录的b里面(b一定不能事先存在)
shutil.copytree(\'a\',\'../b\',ignore=shutil.ignore_patterns(\'*.bat\',\'*.py\'))

# 获取一个路径的磁盘占用,返回一个三元组(total,used,free)
print(shutil.disk_usage(\'D:\\\'))

# 显示支持的打包格式/解压包的格式
print(shutil.get_archive_formats())
print(shutil.get_unpack_formats())

# 打包文件 (包名,格式,要打包的路径)
shutil.make_archive(\'a_zip\',\'zip\',\'a\')

# 移动文件或文件夹到另一路径: (源文件路径,目标路径)
shutil.move(\'a\',\'../\')

# 注册一个新的打包方式?
shutil.register_archive_format()
shutil.register_unpack_format()

# 删除文件夹及其内容,选择是否忽略错误(默认false,没有要删除的文件夹会报错)
shutil.rmtree(\'a\',ignore_errors=True)
# (文件名,[,解压路径,解压方式]) unpack_archive(filename, extract_dir=None, format=None)
shutil.unpack_archive(\'a.zip\',\'a\')

# shutil.unregister_archive_format()
# shutil.unregister_unpack_format()

 

3. 断点复制

import os


def copy_file(remote_file, local_file, block=10240):
    """
    断点复制文件
    :param remote_file: 想要复制的文件
    :param local_file: 复制到本地的文件
    :param block: 每次复制的大小(字节)
    :return:
    """
    try:
        if os.path.exists(local_file):
            copyed_size = os.path.getsize(local_file)
        else:
            copyed_size = 0
        total_size = os.path.getsize(remote_file)
        if copyed_size != total_size:
            remote_f = open(remote_file, \'rb\')
            local_f = open(local_file, \'ab\')
            remote_f.seek(copyed_size, 0)  # 移动源文件指针,从没复制过的那部分开始
            while True:
                con = remote_f.read(block)  # 每次读取 block 大小
                if not con: break  # 为空说明读完了
                local_f.write(con)  # 本地写入
            local_f.close()
            remote_f.close()
    except Exception as e:
        print(e)
        return False
    return True


copy_file(r\'C:\pasd.txt\', r\'password.txt\')

 

分类:

技术点:

相关文章: