Python 7 Python文件操作
文件编码概念
文件编码
思考:计算机只能识别:0和1,那么我们丰富的文本文件是如何被计算机识别,并存储在硬盘中呢?
答案:使用编码技术(密码本)将内容翻译成0和1存入
编码技术即:翻译的规则,记录了如何将内容翻译成二进制,以及如何将二进制翻译会可识别内容
计算机中有许多可用编码:UTF-8、GBK、Big5等
不同的编码,将内容翻译成二进制也是不同的
查看文件编码
我们可以使用Windows系统自带的记事本,打开文件后,即可看出文件的编码是什么
UTF-8是目前全球通用的编码格式
除非有特殊需求,否则,一律以UTF-8格式进行文件编码即可
总结
- 编码就是一种规则集合,记录了内容和二进制间进行相互转换的逻辑
- 编码中我们最常用的是UTF-8编码
- 计算机只0和1,所以需要将内容翻译成0和1才能保存在计算机中
- 同时也需要编码,将计算机保存的0和1,反向翻译回可以识别的内容
文件的读取操作
什么是文件
内存中存放的数据在计算机关机后就会消失。要长久保存数据,就要使用硬盘、光盘、U盘等设备。为了便于数据的管理和检索,引入了”文件“的概念
一篇文章、一段视频、一个可执行程序,都可以被保存为一个文件,并赋予一个文件名。操作系统以文件为单位管理磁盘中的数据。一般来说,文件可分为文本文件、视频文件、音频文件、图像文件、可执行文件等多种类别
open()打开函数
在Python,使用open函数,可以打开一个已经存在的文件,或者创建一个新文件,语法如下
1 | open(name, mode, encoding) |
name:是要打开的目标文件名的字符串(可以包含文件所在的具体路径)
mode:设置打开文件的模式(访问模式):只读、写入、追加等
encoding:编码格式(推荐使用UTF-8)
示例代码:
1 | f=open('python.txt','r',encoding="UTF-8") |
注意:此时的’f’是’open’函数的文件对象,对象是Python中一种特殊的数据类型,拥有属性和方法,可以使用对象.属性或对象.方法对其进行访问
mode常用的三种基础访问模式
模式 | 描述 |
---|---|
r | 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式 |
w | 打开一个文件只用于写入。如果该文件已存在则打开文件,并从开头开始编辑, 原有内容会被删除。如果该文件不存在,创建新文件 |
a | 打开一个文件用于追加。如果该文件已存在,新的内容会被写入到已有内容之后。 如果该文件不存在,创建新文件进行写入 |
读操作相关方法
read()
方法:
1 | 文件对象.read(num) |
num表示要从文件中读取的数据长度(单位是字节),如果没有传入num,那么就表示读取文件中所有的数据
readlines()
方法:
readlines
可以按照行的方式把整个文件中的内容进行一次性读取,并且返回的是一个列表,其中每一行的数据为一个元素
1 | f=open('python.txt') |
readline()
方法:一次读取一行内容
1 | f=open('python.txt') |
close()
关闭文件对象
1 | f = open("python.txt","r") |
读操作相关方法
with open
语法
1 | with open("Python.txt","r") as f: |
操作汇总
操作 | 功能 |
---|---|
文件对象 = open(file, mode, encoding) | 打开文件获得文件对象 |
文件对象.read(num) | 读取指定长度字节 不指定num读取文件全部 |
文件对象.readline() | 读取一行 |
文件对象.readlines() | 读取全部行,得到列表 |
for line in 文件对象 | for循环文件行,一次循环得到一行数据 |
文件对象.close() | 关闭文件对象 |
with open() as f | 通过with open语法打开文件,可以自动关闭 |
总结
- 操作文件需要通过open函数打开文件得到文件对象
- 文件对象有如下读取方法:
read()
readline()
readlines()
for line in 文件对象
- 文件读取完成后,要使用文件对象.close()方法关闭文件对象,否则文件会被一直占用
Demo
1 | """ |
Demo2
1 | """ |
test.txt
1 | itheima itcast python |
运行结果
1 | itheima出现的次数是:6 |
文件的写出操作
写操作快速入门
案例演示:
1 | # 1.打开文件 |
注意:
- 直接调用write,内容并未真正写入文件,而是会积攒在程序的内存中,称之为缓冲区
- 当调用flush的时候,内容会真正写入文件
- 这样做是避免频繁的操作硬盘,导致效率下降(攒一堆,一次性写磁盘)
总结
- 写入文件使用open函数的“w”模式进行写入
- 写入的方法有:
- write(),写入内容
- flush(),刷新内容到硬盘中
- 注意事项:
- w模式,文件不存在,会创建新文件
- w模式,文件存在,会清空原有内容
- close()方法,带有flush()方法的功能
Demo
1 | """ |
文件的追加写入操作
追加写入操作快速入门
案例演示:
1 | # 1.打开文件,通过a模式打开即可 |
注意:
- a模式,文件不存在会创建文件
- a模式,文件存在会在最后,追加写入文件
总结
- 追加写入文件使用open函数的”a”模式进行写入
- 追加写入的方法有(和w模式一致):
- write(),写入内容
- flush(),刷新内容到硬盘中
- 注意事项:
- a模式,文件不存在,会创建新文件
- a模式,文件存在,会在原有内容后面继续写入
- 可以使用“\n”来写出换行符
Demo
1 | """ |
文件操作的综合案例
需求分析
我们现在要做的就是:
- 读取文件
- 将文件写出到bill.txt.bak文件作为备份
- 同时,将文件内标记为测试的数据行丢弃
实现思路:
- open和r模式打开一个文件对象,并读取文件
- open和w模式打开另一个文件对象,用于文件写出
- for循环内容,判断是否是测试不是测试就write写出,是测试就continue跳过
- 将2个文件对象均close()
Demo
1 | """ |
运行结果
test.txt
1 | name,date,money,type,remarks |
test.txt.bak
1 | name,date,money,type,remarks |