百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

python 文件 python文件怎么重新命名

bigegpt 2024-10-05 13:40 3 浏览

目标

文件的概念

文件的基本操作

文件/文件夹的常用操作

文本文件的编码方式

01. 文件的概念

1.1 文件的概念和作用

计算机的 文件,就是存储在某种 长期储存设备 上的一段 数据

长期存储设备包括:硬盘、U 盘、移动硬盘、光盘…

文件的作用

将数据长期保存下来,在需要的时候使用

1.2 文件的存储方式

在计算机中,文件是以 二进制 的方式保存在磁盘上的

文本文件和二进制文件

文本文件

可以使用 文本编辑软件 查看

本质上还是二进制文件

例如:python 的源程序

二进制文件

保存的内容 不是给人直接阅读的,而是 提供给其他软件使用的

例如:图片文件、音频文件、视频文件等等

二进制文件不能使用 文本编辑软件 查看

02. 文件的基本操作

2.1 操作文件的套路

在 计算机 中要操作文件的套路非常固定,一共包含三个步骤:

打开文件

读、写文件

读 将文件内容读入内存

写 将内存内容写入文件

关闭文件

2.2 操作文件的函数/方法

在 Python 中要操作文件需要记住 1 个函数和 3 个方法

open 函数负责打开文件,并且返回文件对象

read/write/close 三个方法都需要通过 文件对象 来调用

2.3 read 方法 —— 读取文件

open 函数的第一个参数是要打开的文件名(文件名区分大小写)

如果文件 存在,返回 文件操作对象

如果文件 不存在,会 抛出异常

read 方法可以一次性 读入 并 返回 文件的 所有内容

close 方法负责 关闭文件

如果 忘记关闭文件,会造成系统资源消耗,而且会影响到后续对文件的访问

注意:read 方法执行后,会把 文件指针 移动到 文件的末尾

# 1. 打开 - 文件名需要注意大小写
file = open("README")
# 2. 读取
text = file.read()
print(text)
# 3. 关闭
file.close()

提示

在开发中,通常会先编写 打开 和 关闭 的代码,再编写中间针对文件的 读/写 操作!

文件指针(知道)

文件指针 标记 从哪个位置开始读取数据

第一次打开 文件时,通常 文件指针会指向文件的开始位置

当执行了 read 方法后,文件指针 会移动到 读取内容的末尾

默认情况下会移动到 文件末尾

思考

如果执行了一次 read 方法,读取了所有内容,那么再次调用 read 方法,还能够获得到内容吗?

答案

不能

第一次读取之后,文件指针移动到了文件末尾,再次调用不会读取到任何的内容

2.4 打开文件的方式

open 函数默认以 只读方式 打开文件,并且返回文件对象

语法如下:

f = open("文件名", "访问方式")

提示

频繁的移动文件指针,会影响文件的读写效率,开发中更多的时候会以 只读、只写 的方式来操作文件

写入文件示例

# 打开文件
f = open("README", "w")
f.write("hello python!\n")
f.write("今天天气真好")
# 关闭文件
f.close()

2.5 按行读取文件内容

read 方法默认会把文件的 所有内容 一次性读取到内存

如果文件太大,对内存的占用会非常严重

readline 方法

readline 方法可以一次读取一行内容

方法执行后,会把 文件指针 移动到下一行,准备再次读取

读取大文件的正确姿势

# 打开文件
file = open("README")
while True:
 # 读取一行内容
 text = file.readline()
 # 判断是否读到内容
 if not text:
 break
 # 每读取一行的末尾已经有了一个 `\n`
 print(text, end="")
# 关闭文件
file.close()

2.6 文件读写案例 —— 复制文件

目标

用代码的方式,来实现文件复制过程

小文件复制

打开一个已有文件,读取完整内容,并写入到另外一个文件

# 1. 打开文件
file_read = open("README")
file_write = open("README[复件]", "w")
# 2. 读取并写入文件
text = file_read.read()
file_write.write(text)
# 3. 关闭文件
file_read.close()
file_write.close()

大文件复制

打开一个已有文件,逐行读取内容,并顺序写入到另外一个文件

# 1. 打开文件
file_read = open("README")
file_write = open("README[复件]", "w")
# 2. 读取并写入文件
while True:
 # 每次读取一行
 text = file_read.readline()
 # 判断是否读取到内容
 if not text:
 break
 file_write.write(text)
# 3. 关闭文件
file_read.close()
file_write.close()

03. 文件/目录的常用管理操作

在 终端 / 文件浏览器、 中可以执行常规的 文件 / 目录 管理操作,例如:

创建、重命名、删除、改变路径、查看目录内容、……

在 Python 中,如果希望通过程序实现上述功能,需要导入 os 模块

文件操作

目录操作

提示:文件或者目录操作都支持 相对路径 和 绝对路径

04. 文本文件的编码格式(科普)

文本文件存储的内容是基于 字符编码 的文件,常见的编码有 ASCII 编码,UNICODE 编码等

Python 2.x 默认使用 ASCII 编码格式

Python 3.x 默认使用 UTF-8 编码格式

4.1 ASCII 编码和 UNICODE 编码

ASCII 编码

计算机中只有 256 个 ASCII 字符

一个 ASCII 在内存中占用 1 个字节 的空间

8 个 0/1 的排列组合方式一共有 256 种,也就是 2 ** 8

UTF-8 编码格式

计算机中使用 1~6 个字节 来表示一个 UTF-8 字符,涵盖了 地球上几乎所有地区的文字

大多数汉字会使用 3 个字节 表示

UTF-8 是 UNICODE 编码的一种编码格式

4.2 Ptyhon 2.x 中如何使用中文

Python 2.x 默认使用 ASCII 编码格式

Python 3.x 默认使用 UTF-8 编码格式

在 Python 2.x 文件的 第一行 增加以下代码,解释器会以 utf-8 编码来处理 python 文件

# *-* coding:utf8 *-*

这方式是官方推荐使用的!

也可以使用

# coding=utf8

unicode 字符串

在 Python 2.x 中,即使指定了文件使用 UTF-8 的编码格式,但是在遍历字符串时,仍然会 以字节为单位遍历 字符串

要能够 正确的遍历字符串,在定义字符串时,需要 在字符串的引号前,增加一个小写字母 u,告诉解释器这是一个 unicode 字符串(使用 UTF-8 编码格式的字符串)

# *-* coding:utf8 *-*
# 在字符串前,增加一个 `u` 表示这个字符串是一个 utf8 字符串
hello_str = u"你好世界"
print(hello_str)
for c in hello_str:
 print(c)

相关推荐

C#.NET Autofac 详解(c# autoit)

简介Autofac是一个成熟的、功能丰富的.NET依赖注入(DI)容器。相比于内置容器,它额外提供:模块化注册、装饰器(Decorator)、拦截器(Interceptor)、强o的属性/方法注...

webapi 全流程(webapi怎么部署)

C#中的WebAPIMinimalApi没有控制器,普通api有控制器,MinimalApi是直达型,精简了很多中间代码,广泛适用于微服务架构MinimalApi一切都在组控制台应用程序类【Progr...

.NET外挂系列:3. 了解 harmony 中灵活的纯手工注入方式

一:背景1.讲故事上一篇我们讲到了注解特性,harmony在内部提供了20个HarmonyPatch重载方法尽可能的让大家满足业务开发,那时候我也说了,特性虽然简单粗暴,但只能解决95%...

C# 使用SemanticKernel调用本地大模型deepseek

一、先使用ollama部署好deepseek大模型。具体部署请看前面的头条使用ollama进行本地化部署deepseek大模型二、创建一个空的控制台dotnetnewconsole//添加依赖...

C#.NET 中间件详解(.net core中间件use和run)

简介中间件(Middleware)是ASP.NETCore的核心组件,用于处理HTTP请求和响应的管道机制。它是基于管道模型的轻量级、模块化设计,允许开发者在请求处理过程中插入自定义逻辑。...

IoC 自动注入:让依赖注册不再重复劳动

在ASP.NETCore中,IoC(控制反转)功能通过依赖注入(DI)实现。ASP.NETCore有一个内置的依赖注入容器,可以自动完成依赖注入。我们可以结合反射、特性或程序集扫描来实现自动...

C#.NET 依赖注入详解(c#依赖注入的三种方式)

简介在C#.NET中,依赖注入(DependencyInjection,简称DI)是一种设计模式,用于实现控制反转(InversionofControl,IoC),以降低代码耦合、提高可...

C#从零开始实现一个特性的自动注入功能

在现代软件开发中,依赖注入(DependencyInjection,DI)是实现松耦合、模块化和可测试代码的一个重要实践。C#提供了优秀的DI容器,如ASP.NETCore中自带的Micr...

C#.NET 仓储模式详解(c#仓库货物管理系统)

简介仓储模式(RepositoryPattern)是一种数据访问抽象模式,它在领域模型和数据访问层之间创建了一个隔离层,使得领域模型无需直接与数据访问逻辑交互。仓储模式的核心思想是将数据访问逻辑封装...

C#.NET 泛型详解(c# 泛型 滥用)

简介泛型(Generics)是指在类型或方法定义时使用类型参数,以实现类型安全、可重用和高性能的数据结构与算法为什么需要泛型类型安全防止“装箱/拆箱”带来的性能损耗,并在编译时检测类型错误。可重用同一...

数据分析-相关性分析(相关性 分析)

相关性分析是一种统计方法,用于衡量两个或多个变量之间的关系强度和方向。它通过计算相关系数来量化变量间的线性关系,从而帮助理解变量之间的相互影响。相关性分析常用于数据探索和假设检验,是数据分析和统计建模...

geom_smooth()函数-R语言ggplot2快速入门18

在每节,先运行以下这几行程序。library(ggplot2)library(ggpubr)library(ggtext)#用于个性化图表library(dplyr)#用于数据处理p...

规范申报易错要素解析(规范申报易错要素解析)

为什么要规范申报?规范申报是以满足海关监管、征税、统计等工作为目的,纳税义务人及其代理人依法向海关如实申报的行为,也是海关审接单环节依法监管的重要工作。企业申报的内容须符合《中华人民共和国海关进出口货...

「Eurora」海关编码归类 全球海关编码查询 关务服务

  海关编码是什么?  海关编码即HS编码,为编码协调制度的简称。  其全称为《商品名称及编码协调制度的国际公约》(InternationalConventionforHarmonizedCo...

9月1日起,河南省税务部门对豆制品加工业试行新政7类豆制品均适用投入产出法

全媒体记者杨晓川报道9月2日,记者从税务部门获悉,为减轻纳税人税收负担,完善农产品增值税进项税额抵扣机制,根据相关规定,结合我省实际情况,经广泛调查研究和征求意见,从9月1日起,我省税务部门对豆制品...