1.内置的open()函数会创建一个Python文件对象,可以作为计算机上的一个文件的引用。
2.打开文件:outfile=open(r'C:\filename','w'):
-
第一个参数
r'C:\filename'为文件名字符串 -
第二个参数
'w'为打开模式字符串。有以下三种:'r':读打开(默认行为)'w':写打开'a':追加写打开
- 第二个参数也可以添加
'b'表示二进制处理。二进制处理中,换行符未转换, 同时Python3中 Unicode编码被关闭 - 第二个参数也可以添加
'+'表示读写同时作用
3.文件对象的方法:
-
文件读入:
-
写入文件:
-
关闭文件:
.close()方法。 -
刷新输出缓冲区:
.flush()方法。通常关闭文件会将输出缓冲区内容写入到文件中;但用.flush()方法不必关闭文件。 -
定位文件:
.seek(N)方法,将文件偏移修改到字节N处以便进行下一次操作 -
文件迭代:文件对象也是一个可迭代对象,每一次迭代返回一行,对于大型文件一次性读取非常耗内存和性能:
for line in open('data'):#每次循环迭代时,自动读取并返回一行 #use line pass -
读写文本文件时,默认的编码是
utf-8,你也可以使用指定的编码:open(r'filename',encoding='latin-1')
4.从文本文件中读取文字行的最佳方式是用文件迭代器,不要直接读取文件
5.当文件对象被自动收回时,Python会自动关闭该文件,这意味着不一定要手动调用.close()方法
6.默认的写操作总是缓冲的。当文件关闭或者.flush()方法调用时,缓冲的输出数据会写入硬盘。
7.文件的空行是含有换行符的字符串,而不是空字符串。因此如果读入操作返回空字符串,则表示已经到文件末尾了。
8.Python3中,文本文件将内容表示为常规的str字符串,自动执行Unicode编码和解码,并且默认执行行末转换。而二进制文件将内容表示为一个特殊的bytes字节串类型,且运行程序不修改地访问文件内容。
不能以文本格式打开一个二进制数据文件,会乱码
9.可以在文件中存储并解析Python对象。由于文件数据在脚本中是字符串,文件对象的.write()方法不会自动地将Python对象转成字符串,因此需要手工转换。
- 可以用格式化字符串方法或者
str()方法将Python对象转成字符串 - 将字符串转换成Python对象可以用
eval()方法 - 或者直接使用
pickle模块自动存储和解析Python对象:
10.struct模块能够打包/解包二进制数据
- 打包:
data=struct.pack('>i4sh',7,b'abcd',8)。其中第一个参数为格式说明字符串,后面的参数为待打包的数据。格式说明字符串为:>为说明符i说明第一个待打包的数据为整数4s说明第二个待打包的数据为4个字节的字节串h说明第三个待打包的数据为16进制整数
- 解包:
val=struct.unpack('>i4sh,data)`。其中第一个参数为格式说明符,第二个参数为已经打包的二进制数据,返回一个元组。
11.sys模块中有几个预先打开的文件对象:
13.socket、pipe、FIFO文件对象可以用于网络通信与进行同步