百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

[Linux探索之旅]第二部分第九课:查找文件,无所遁形

bigegpt 2025-03-04 10:54 10 浏览

内容简介

1、第二部分第九课:查找文件,无所遁形

2、第二部分测试题

查找文件,无所遁形

这一课不难,但挺重要的。

之前的课程我们见识过了Linux下文件的组织形式是很特别的,跟Windows不一样。

我们也用ls / 这个命令来列出根目录下的所有目录,有/bin,/etc,/var,/home,等等。而这些目录下又有子目录和文件,错综复杂。

这些目录中有一部分是历史遗留的,从Unix时代就有了。问题是:我们如何在这“茫茫文海”中查找我们需要的文件。

“人潮人海中,有你有我。相遇相识,相互琢磨”(黑豹乐队的《无地自容》),小编你可以了...

不要担心,这一课我们就来学习Linux中用于文件查找的工具。

有的工具查找起来快,但是不全面;有的比较慢,但是全面。

一起来学习吧。

locate命令,快速查找

第一种查找文件的方法可以说是很简单的。用到的命令是locate。

locate是英语“定位”的意思。这个命令用于定位要查找的文件,而且此命令很快。

locate命令的用法也很直观,后接需要查找的文件名(当然也可以用正则表达式)。

例如我们来查找一个叫做 renamed_file的文件:

locate renamed_file

可以看到locate命令帮我们找到了renamed_file文件,位于 /home/oscar/linux_c目录下。

我们再来用locate查找france文件:

我们运行locate france后,终端列出了所有包含france的文件和目录。

所以locate命令是搜索包含关键字的所有文件和目录。

文件的数据库

在使用locate命令查找文件时,大家可能会遇到这样的问题:我刚创建的文件,为什么用locate命令查找不到呢?

这正好是locate命令的缺陷,我正要说到:locate命令不会对你实际的整个硬盘进行查找,而是在文件的数据库里查找记录。

locate命令的原理如下图所示:

对于刚创建不久的文件,因为它们还没被收录进文件数据库,因此locate命令就找不到其索引,自然就不会返回任何结果。

Linux系统一般每天会更新一次文件数据库。因此,只要你隔24小时再用locate查找,应该就能找到你刚创建的文件了。

但是你会说:“臣妾不想等这么久啊。难道哀家要在这深宫之中等候多时么?”

当然不是,甄嬛不会一直赢的,皇后总有出头之日。

我们可以用updatedb命令强制系统立即更新文件数据库。但是updatedb命令只能由root用户执行。

update是英语“更新”的意思;db是英语database的缩写,表示“数据库”。所以连起来就是“更新数据库”。

因此我们可以这样:

sudo updatedb

这个命令执行会需要一点时间,小编执行的时候大概等了几分钟才完毕。

一旦执行成功,你再用locate查找你刚才创建的文件,就可以找到了。

总结一下:locate命令方便快捷,易于使用。但缺点也很明显:

  1. locate命令会列出所有在文件数据库中找到的内容,有时候结果太多了,太繁杂。

  2. locate命令不能找到一天之内刚创建的文件,除非你先用root身份运行updatedb命令来更新文件数据库。

当locate命令不够用时,我们需要一个更强大的命令,它就是find命令。

find命令,深入查找

find是英语“找到”的意思,find命令也用于查找文件。

find命令是查找文件的利器,而且它可以让我们对每个找到的文件做后续的操作。find命令非常强大,可以做很多事情,但是也因此比较复杂。

find命令可以说是Linux中最常用的命令之一了。所以,一起来探秘吧。

find命令查找当前实际的文件

与locate命令不同,find命令不会在文件数据库中查找文件的记录,而是遍历你的实际硬盘。

所以,如果你的硬盘容量很大的话,那find命令会查找比较久。

find命令的原理如下图所示:

find命令的这种耿直的查找方式保证了我们不会遗漏一天之内创建的文件。但这绝对不是find的唯一强大之处,远远不是。

find命令的功能

find命令的用法是这样的:

find 《何处》《何物》《做什么》

这几个参数中,只有《何物》是必须指定的,也就是要查找什么。

  1. 何处:指定在哪个目录中查找。此目录的所有子目录也会被查找。与locate命令的查找所有文件数据库的所有记录不同,find命令可以限定查找目录,比如我们可以只让find查找/home目录。默认地,假如我们没有给出《何处》这个参数,那么find命令会在当前目录及其子目录中查找。

  2. 何物:也就是要查找什么。我们可以根据文件的名字来查找,也可以根据其大小来查找,也可以根据其最近访问时间来查找,等等。这个参数是必须的。

  3. 做什么:用find命令找到我们要的文件后,可以对每个文件做一定的操作,称为“后续处理”。默认地,假如不指定这个参数,那么find命令只会显示找到的文件,不会做其他事情。

find命令的基础用法

根据文件名查找

我们首先来学习最基本的查找:用文件名来查找。

首先,我们定位到用户的家目录中(对于小编来说是/home/oscar),然后我要在当前目录及其子目录中查找france1.jpg这个文件。France是“法国”的意思。

find -name "france1.jpg"

这里,我们用-name参数指定了文件名字,是france1.jpg,用双引号括起来。不加双引号或者用单引号也是可以的。

name是英语“名字”的意思。

经过了一点时间,查找才停止,因为find命令会遍历指定的所有目录。

最终,find命令找到了france1.jpg这个文件,位于/home/oscar/Photos 目录下。

如果find命令没有结果显示,那么表示此文件不存在。

因为我们没有指定《何处》这个参数,所以find命令就会在当前目录(~,也就是用户的家目录中,/home/oscar)及其子目录中查找。

假如,现在我位于我的家目录中,我却想在其他目录中进行查找,怎么办呢?

那就须要指定《何处》这个参数了。

例如,我要在/var/log目录下查找名为syslog的文件,我应该这么输入:

find /var/log "syslog"

但是,作为普通用户的oscar,没有权限在var/log的子目录中查找。因此,显示:

Permission denied

permission是“许可”的意思,denied是“否决”的意思。就是说没有权限做这事。

我们可以切换成root身份,再来执行查找。

sudo su

find /var/log "syslog"

可以看到,切换成root后,就可以查找了。并且找到了两个结果:

/var/log/installer/syslog

/var/log/syslog

在上面的查找中,我们的参数如下:

  1. 何处:/var/log(及它的子目录)

  2. 何物:syslog

没有指定《做什么》参数,因此find命令默认显示了查找到的文件。

我们注意到了:与locate命令不同的是,find命令只会查找完全符合《何物》的字符串表示的文件。locate会查找所有包含关键字的文件。比如,如果要用find来找thing这个文件,那么只会找到名字就是thing的文件;而locate命令会查找到比如thing,thing1,onething,twothings这样的文件。

因此,我们用find查找syslog文件时,就不会查找到syslog2这样的文件。

不过我们可以用我们之前学过的通配符:*(星号)来实现匹配多个名称。

例如,我要查找所有以syslog这个关键字开头的文件,可以这样来实现:

find /var/log -name "syslog*"

可以看到,在syslog之后加了*之后,就会匹配凡是以syslog开头的文件了,因为*号是匹配一个或多个任意字符。

那聪明如你肯定想到了,如果要查找以syslog结尾的文件,可以用:*syslog

那你肯定也知道,如何查找包含syslog这个关键字的文件,可以用 *syslog*

那如果我要在整个硬盘里查找怎么做呢?很简单:

find / -name "syslog"

在Linux的根目录查找很花时间,而且,如果你不是以root身份查找的话,就会有很多目录提示你“无权限访问”。

根据文件大小查找

如果你不知道你要找的文件的名称,那怎么办呢?

不要担心,还有其他方式来查找文件的。

我们先来看如何根据文件大小查找。

例如,我们可以查找/var中大小超过10M的文件(当然你要以root身份):

find /var -size +10M

这次,我们使用了-size参数,来指定查找文件的大小。size是英语“尺寸,大小”的意思。

后面紧跟的+10M表示大于10兆字节。M是兆,也就是10的6次方;平时我们所说的多少个Ko,Mo,Go其实分别是千字节,兆字节,千兆字节,一个字节是8位二进制数。我们说硬盘512G,就是硬盘容量有512千兆字节(虽然实际容量是不到的,不深究)。

如果我们要查找小于指定大小的文件,可以用减号。例如:

find /var -size -50K

表示查找小于50Ko的文件。

find /var -size +20G

表示查找大于20Go的文件。

如果没有加减号,则查找大小等于指定数值的文件。

根据文件的最近访问时间查找

如果你记得你近7天里在家目录中访问过JPG格式的图片,但是你忘记它们的名字了,如何查找呢?

可以使用-atime参数。atime是access和time的缩写,access是英语“访问,进入”的意思,time是英语“时间”的意思。

可以这样查找:

find -name "*.jpg" -atime -7

-atime参数后面紧跟的-7表示7天之内,减号的作用是表示小于。

仅查找目录或文件

我们可以指定查找的文件类型,我们知道Linux中文件的类型大致分为两种:目录和文件。

因此,我们可以用-type参数来指定查找的文件类型。type是英语“类型”的意思。

  1. -type d:只查找目录类型。d是directory的首字母,表示“目录”。

  2. -type f:只查找文件类型。f是file的首字母,表示“文件”。

如果不用-type参数指定类型,那么find命令默认是查找目录和文件的。比如说,有syslog这个文件,和syslog这个目录,那么find会把他们都查找出来。

用法如下:

find /var/log -name "mysql" -type d

可以看到只查找到了mysql这个目录。

find命令的高级用法:操作查找结果

到目前为止,我们只是使用了find的基本功能。我们并没有指定《做什么》这个参数,也就是还没对查找到的结果做任何操作。

当然了,默认地,find命令会显示每个查找到的文件。

事实上,

find -name "*.jpg"

等价于

find -name "*.jpg" -print

-print参数用于打印结果。print是英语“打印”的意思。

格式化打印查找结果

默认地,find命令只列出查找到的文件,但是我们可以将其用格式化的方式打印出来。

我们可以使用-printf参数。是不是想起了C语言中的printf函数?是的,printf是print formatted的缩写,表示“格式化打印”。

例如,我们可以这样打印查找到的内容:

find ~/Photos -name "*.jpg" -printf "%p - %u\n"

我们在-printf参数后面写了"%p - %u\n",这个格式字符串的意思如下:

  1. %p:文件名。

  2. -:就是一个短横。

  3. %u:文件的所有者,这里是小编的用户名,所以是oscar。

  4. \n:用于换行。

可以看到,用法和C语言的printf函数很类似。

删除查找到的文件

假如我要删除查找到的文件,我可以用-delete参数。用法很简单:

find -name "*.jpg" -delete

将会删除当前目录及其子目录下所有以.jpg为后缀的文件。而且不会有确认提示。所以慎用-delete参数。

调用命令

使用-exec参数,可以后接一个命令,对每个查找到的文件进行操作。

exec是execute的缩写,是英语“执行”的意思。

假设我想要将当前目录下所有查找到的JPG文件的访问权限都改为600,那么我们可以这样做:

find -name "*.jpg" -exec chmod 600 {} \;

就是说对于每个找到的.jpg结尾的文件,都进行-exec参数指定的操作:

  1. 这个操作不必用双引号括起来。

  2. {} 会用查找到的每个文件来替换。

  3. \; 是必须的结尾。

虽然-exec参数一开始有点看不懂其用法,但是慢慢地你会发现,这个参数太强大了,你可以对查找到的文件做任何你想要的操作。

如果你对于没有确认提示不太放心,你可以将-exec参数换成-ok参数,用法一样,只不过-ok参数会对每一个查找到的文件都做确认提示,输入y加回车表示对此文件进行此操作;输入n加回车表示对此文件不进行此操作。

总结

  1. 为了在Linux硬盘中查找一个文件,我们可以用locate命令。这个命令很快,因为它不会实际遍历硬盘,而是在被称为文件数据库的记录里查找,所以它找不到刚添加的文件。为了更新文件数据库,我们可以用root用户身份运行updatedb命令。

  2. find命令比locate命令更强大,用法更多样。它会遍历实际的硬盘来查找文件,所以更慢,但是更精确。find命令可以跟三个参数:《何处》,《何物》,《做什么》。

  3. 可以根据文件的名字来查找,用-name参数;根据大小来查找,用-size参数;根据最后访问时间来查找,用-atime参数。等等。

  4. 查找到了文件,我们也可以选择不显示,而是删除文件,用-delete参数,或者对文件执行命令,用-exec参数。

第二部分测试题预告

今天的课就到这里,一起加油吧!

下一课:第二部分测试题

*新朋友请关注「程序员联盟」微信搜公众号 ProgrammerLeague

程序员联盟官网:

coderunity点com

小编微信号: frogoscar

小编邮箱: enmingx@gmail.com

相关推荐

pyproject.toml到底是什么东西?(py trim)

最近,在Twitter上有一个Python项目的维护者,他的项目因为构建失败而出现了一些bug(这个特别的项目不提供wheel,只提供sdist)。最终,发现这个bug是由于这个项目使用了一个pypr...

BDP服务平台SDK for Python3发布(bdp数据平台)

下载地址https://github.com/imysm/opends-sdk-python3.git说明最近在开发和bdp平台有关的项目,用到了bdp的python的sdk,但是官方是基于p...

Python-for-Android (p4a):(python-for-android p4a windows)

一、Python-for-Android(p4a)简介Python-for-Android(p4a),一个强大的开发工具,能够将你的Python应用程序打包成可在Android设备上运行...

Qt for Python—Qt Designer 概览

前言本系列第三篇文章(QtforPython学习笔记—应用程序初探)、第四篇文章(QtforPython学习笔记—应用程序再探)中均是使用纯代码方式来开发PySide6GUI应用程序...

Python:判断质数(jmu-python-判断质数)

#Python:判断质数defisPrime(n):foriinrange(2,n):ifn%i==0:return0re...

为什么那么多人讨厌Python(为什么python这么难)

Python那么棒,为什么那么多人讨厌它呢?我整理了一下,主要有这些原因:用缩进替代大括号许多人抱怨Python完全依赖于缩进来创建代码块,代码多一点就很难看到函数在哪里结束,那么你就需要把一个函数拆...

一文了解 Python 中带有 else 的循环语句 for-else/while-else

在本文中,我们将向您介绍如何在python中使用带有else的for/while循环语句。可能许多人对循环和else一起使用感到困惑,因为在if-else选择结构中else正常...

python的numpy向量化语句为什么会比for快?

我们先来看看,python之类语言的for循环,和其它语言相比,额外付出了什么。我们知道,python是解释执行的。举例来说,执行x=1234+5678,对编译型语言,是从内存读入两个shor...

开眼界!Python遍历文件可以这样做

来源:【公众号】Python技术Python对于文件夹或者文件的遍历一般有两种操作方法,一种是至二级利用其封装好的walk方法操作:import osfor root,d...

告别简单format()!Python Formatter类让你的代码更专业

Python中Formatter类是string模块中的一个重要类,它实现了Python字符串格式化的底层机制,允许开发者创建自定义的格式化行为。通过深入理解Formatter类的工作原理和使用方法,...

python学习——038如何将for循环改写成列表推导式

在Python里,列表推导式是一种能够简洁生成列表的表达式,可用于替换普通的for循环。下面是列表推导式的基本语法和常见应用场景。基本语法result=[]foriteminite...

详谈for循环和while循环的区别(for循环语句与while循环语句有什么区别)

初九,潜龙勿用在刚开始使用python循环语句时,经常会遇到for循环和while循环的混用,不清楚该如何选择;今天就对这2个循环语句做深入的分析,让大家更好地了解这2个循环语句以方便后续学习的加深。...

Python编程基础:循环结构for和while

Python中的循环结构包括两个,一是遍历循环(for循环),一是条件循环(while循环)。遍历循环遍历循环(for循环)会挨个访问序列或可迭代对象的元素,并执行里面的代码块。foriinra...

学习编程第154天 python编程 for循环输出菱形图

今天学习的是刘金玉老师零基础Python教程第38期,主要内容是python编程for循环输出菱形※。(一)利用for循环输出菱形形状的*号图形1.思路:将菱形分解为上下两个部分三角形图案,分别利用...

python 10个堪称完美的for循环实践

在Python中,for循环的高效使用能显著提升代码性能和可读性。以下是10个堪称完美的for循环实践,涵盖数据处理、算法优化和Pythonic编程风格:1.遍历列表同时获取索引(enumerate...