昨天我们学习了文件指针与定位技巧。今天,我们将探索如何操作二进制文件,这在处理图片、视频、音频等非文本数据时非常重要。
什么是二进制文件?
二进制文件存储的是原始字节数据,而不是文本内容。这些数据可能包括图像像素、音频波形或其他非可见字符。
Python 使用二进制模式(b)打开文件来处理此类数据。
打开二进制文件
通过在 open() 方法中加入 b 模式标志,可以以二进制模式读取或写入文件。
# 打开二进制文件以读取
with open('example.bin', 'rb') as file:
data = file.read() # 读取所有字节
# 打开二进制文件以写入
with open('example.bin', 'wb') as file:
file.write(b'\x00\x01\x02') # 写入字节数据
1. 读取二进制文件
与文本文件类似,二进制文件可以通过 read() 和 readlines() 方法读取,但返回的内容是 bytes 类型而非字符串。
示例:读取图片文件
with open('image.jpg', 'rb') as file:
data = file.read() # 读取整个图片文件
print(f"文件大小: {len(data)} 字节")
2. 写入二进制文件
写入时需要提供 bytes 类型数据。可以通过 b 前缀定义字节数据。
示例:写入二进制数据
binary_data = b'\x42\x4d\x38\x00\x00\x00' # 示例二进制数据
with open('output.bin', 'wb') as file:
file.write(binary_data)
上述代码会在文件 output.bin 中写入指定的字节数据。
3. 使用 struct模块解析二进制数据
对于复杂的二进制文件,可以借助 Python 的 struct 模块将字节数据解析为对应的 Python 类型。
示例:读取二进制文件的整数数据
假设文件 data.bin 中存储了 4 字节的整数:
import struct
with open('data.bin', 'rb') as file:
data = file.read(4) # 读取 4 字节
value = struct.unpack('i', data)[0] # 将字节解析为整数
print(f"解析结果: {value}")
- i 表示 4 字节整数。
- 返回的是元组,取第一个元素即可。
4. 复制二进制文件
可以使用二进制模式读取和写入文件来完成文件的复制操作。
示例:
with open('source.jpg', 'rb') as source_file:
with open('copy.jpg', 'wb') as copy_file:
copy_file.write(source_file.read())
上述代码会将 source.jpg 的内容完全复制到 copy.jpg。
练习任务
- 使用 open() 方法以二进制模式打开任意图片文件,打印其前 20 个字节。
- 创建一个文件 numbers.bin,将数字 1 到 10 以二进制形式写入文件。
- 编写一个函数 read_numbers(file_name),解析 numbers.bin 文件并输出所有数字。
示例函数:
import struct
def read_numbers(file_name):
with open(file_name, 'rb') as file:
numbers = []
while chunk := file.read(4):
numbers.append(struct.unpack('i', chunk)[0])
return numbers
# 写入数字
with open('numbers.bin', 'wb') as file:
for i in range(1, 11):
file.write(struct.pack('i', i))
# 读取并打印
print(read_numbers('numbers.bin'))
完成这些任务后,你将掌握二进制文件的基础操作技巧。明天我们将学习文件的异常处理与安全操作,敬请期待!