百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

Linux 文件搜索神器 find 实战详解,建议收藏

bigegpt 2025-03-04 10:53 9 浏览

在 Linux 系统使用中,作为一个管理员,我希望能查找系统中所有的大小超过 200M 文件,查看近 7 天系统中哪些文件被修改过,找出所有子目录中的可执行文件,这些任务需求 find 命令都可以轻松胜任。

在 Linux 系统文件中常用的属性可以分为以下内容:名称、大小、权限、属主、修改时间、访问时间等,find 命令可以按照指定的属性为条件进行查找。

废话不多,直接开干,下边进入案例实战。

案例实战

(一)按文件名称查找

按照文件名称查找是 find 最常见的用法,需要注意的是,搜索的文件名必须完全匹配,才能找到对应的文件。

1. 查找当前目录下所有 go 文件

$?find?.?-name?"*.go"

2. 在 etc 目录下,查找大写字母开头的 txt 文件

$?find?/etc?-name?"[A-Z]*.txt"?-print

3. 在当前目录下查找不是 out 开头的 txt 文件

$?find?.?-name?"out*"?-prune?-o?-name?"*.txt"?-print

4. 在当前目录除 git 子目录外查找 txt 文件

$?find?.?-path?"./git"?-prune?-o?-name?"*.txt"?-print

5. 找出某个文件的所有硬链接,ls 命令 -i 选项可以查看文件的 inode 号

$?ls?-i?1.txt
138956?1.txt
$?find?.?-num?138956

这里补充一个小技巧,搜索文件时使用 -iname 参数可以忽略文件名称大小写

(二)按文件类型查找

1. 在当前目录下,查找软连接文件

$?find?.?-type?l?-print

2. 在当前目录下,查找 log 结尾的普通文件,f 表示普通文件类型

$?find?.?-type?f?-name?"*.log"

(三)按文件大小查找

1. 查找小于 64k 的文件

$?find?.?-size?-64k?-print

2. 查找大小超过 200M 的文件

$?find?.?-size?+200M?-type?f?-print

(四)按时间查找

1. 查找 2 天内被修改过的文件

$?find?.?-mtime?-2?-type?f?-print

2. 查找 2 天前被更改过的文件,-mtime 表示内容修改时间

$?find?.?-mtime?+2?-type?f?-print

3. 查找一天内被访问的文件,-atime 表示访问时间

$?find?.?-atime?-1?-type?f?-print

4. 查找一天内状态被改变的文件,-ctime 表示元数据被变化时间

$?find?.?-ctime?-1?-type?f?-print

5. 查找比 chopin.txt 新的文件

$?find?.?-newer?"chopin.txt"?-type?f?-print
$?find?.?!?-newer?"chopin.txt"?-type?f?-print?#?旧

(五)根据权限查找

1. 查找当前目录权限为 644 的文件

$?find?.?-type?f?-perm?644

2. 查找 etc 目录下至少有一个用户有写权限的文件

$?find?/etc?-type?f?-perm?/222

3. 查找 etc 目录下所有用户都有执行权限的文件

$?find?/etc?-perm?-111?-ls

(六)组合条件

1. 查找当前目录下属于 chopin 用户的普通文件,-a 可以省略

$?find?.?-type?f?-a?-user?chopin?-print

2. 查找当前目录下大于 2M 或 2 天前被修过的文件

$?find?.?-size?+2M?-o?-mtime?+2?-print

3. 查找当前目录下不是普通文件

$?find?.?-not?-type?f
$?find?.?!?-type?f

4. 查找非空文件

$?find?.?!?-empty

(七)处理动作

find 根据上述各种条件查找后,支持执行相关的处理动作,可以让我们的更方便和灵活,而不只是打印出来

1. -print 默认为打印,可省略

$?find?.?-name?"*.log"?-print
$?find?.?-name?"*.log"?#?等价

2. -ls 以 ls 长文件的格式形式输出

$?find?.?-name?"*.txt"?-ls
138957??????4?-rw-r--r--???1?root?????root???????????16?Jan?24?23:20?./a.txt
138959??????4?-rw-r--r--???1?root?????root??????????172?Jan?24?13:06?./T.txt
138956??????4?-rw-r--r--???1?root?????root???????????27?Jan?24?23:28?./1.txt

3. -delete 删除查找到的文件

$?find?.?-size?+100M?-delete

4. -exec 将查找到的文件传递给 command 命令。下边例子是将查找到的文件传递给了 ls 命令,同理我们可以传递给任何一个 Linux 命令,功能十分强大,也很灵活。

$?find?.?-name?"*.txt"?-exec?ls?-lh?{}?\;
-rw-r--r--?1?root?root?16?Jan?24?23:20?./a.txt
-rw-r--r--?1?root?root?172?Jan?24?13:06?./T.txt
-rw-r--r--?1?root?root?27?Jan?24?23:28?./1.txt

5. -ok-exec 功能一样,只是操作时会提示用户确认,仅此而已。当然,在生产环境上,我们还是推荐使用 ok

(八)经典案例

如果存在一个名称乱码的文件,想要删除它,该怎么办?即使我们复制乱码名称到命令行,很有可能终端不能正确识别。不用担心,下边来展示下 find 是如何优雅的解决问题的。

$?ls??-i
138957?a.txt??138959?T.txt??132395????.txt

$?find?.?-inum?132395?-exec?rm?{}?\;

命令中,-inum 指定的是文件的 inode 号,它是系统中每个文件对应的唯一编号,find 通过编号找到后,执行删除操作。

总结归纳

find 命令是 Linux 命令中最有用的命令之一,它的功能非常强大,且语法复杂。其实我们不一定需要了解它的所有细节,掌握上述实战案例中的常见用法,足够满足日常工作中的大部分需求。

下边我们一起来总结下 find 命令常见用法,加深对 find 使用方法的理解。

命令格式

find path -option [-exec ...]

按文件名查找

  • -name:按照文件名称查找,准确匹配;
  • -iname:不区分文件名的大小写;
  • -inode:按照文件 inode 号查找;

按照文件类型查找

按照文件类型查找,可以使用 -type 选项,具体支持的文件类型如下:

  • f:普通文件
  • d:目录文件
  • l:链接文件
  • s:套接字文件
  • p:管道文件
  • b:块设备文件,比如:磁盘
  • c:字符设备文件,比如:键盘、鼠标、网卡

按照文件从属关系查找

  • -user:以用户名查找
  • -group:以组名查找
  • -uid:以用户 ID 查找
  • -gid:以组 ID 查找
  • -nouser:查找没有属主的文件
  • -nogroup:查找没有属组的文件

按照文件大小查找

按照文件大小查找功能十分常用,用 -size 选项,选项后边指定大小 1024M,表示大小的格式有如下几种:

  • -5M:查找小于 5M 的文件
  • +5M:查找大于 5M 的文件
  • 5M:查找大小为 5M 的文件

单位支持的有 c(字节)kMG 等,需要注意的是默认单位并不是字节,而是 b,大小为 512 字节。

按照时间查找

按照时间查找的功能对系统管理员来说,十分常用,find 支持如下几种时间类型:

  • atime:以访问时间查找
  • mtime:以数据修改时间查找
  • ctime:以元数据修改时间查找
  • newer:以文件为条件,判断比它新的文件

按时间查找时,使用格式如下:

  • -atime -5:表示 5 天内访问过的文件;
  • -atime +5:表示 6 天前访问过的文件;
  • -atime 5:表示前 5-6 那一天访问的文件;

这个 +5 含义总是被人理解错,误认为是 5 天后修改的文件,如果能知道未来 5 天的事情,小编早就去买彩票了!可能这么说还不是很清楚,直接看图吧!

find 不仅可以按 为单位来查找文件,可以按照 aminmmincmin 来查找,区别只是 min 选项单位为分钟。

按照权限查找

按权限查找是通过 -perm 选项,可以按照如下方式使用:

  • -perm 644:精确权限查找
  • -perm /666:任何一类用户中的任何一位符合条件即满足
  • -perm -222:每一类用户的每一位同时符合条件即满足

组合条件

find 可以使用多个条件的组合,支持 -a-o-not!,比较简单,不再详细描述其含义。

处理动作

find 根据各种条件查找后,支持执行相关的处理动作,可以让我们的更方便和灵活,而不只是打印出来。

  • -print:打印,默认动作,可省略
  • -ls:以 ls 长文件格式输出
  • -delete:删除查找到的文件
  • -exec:查找到的文件传递给任何 Linux 命令
  • -ok:与 exec 功能相同,区别是需要用户确认每次的操作

再啰嗦一下,find 命令支持的参数和选项比较多,文中只是总结出最常用、核心的参数选项。如果上述命令确实不满足需求,可以请教你的男人 man find

这里需要提一下,find 搜索文件时通过扫描磁盘来进行的,尽可能不要大范围的搜索文件,尤其是在 / 目录下搜索,会长时间消耗服务器的 cpu 资源。如果是生产环境的机器,执行前要考虑是否会对业务造成影响。

扩展 locate

虽然 find 功能非常强大,但要知道的是,find 执行过程是通过扫描磁盘文件来进行查找的,如果大范围的查找文件,需要花费的时间很长,且消耗服务器 cpu 资源。

这里推荐另一个 Linux 文件查找神器 locate,类似于 win 平台下的 everything。它基于索引表进行查询,查询速度非常快,基本不占用 cpu 资源。

使用方法非常简单

$?locate?file.txt
$?locate?/etc/httpd

需要注意,如果是当天新创建的文件,通过 locate 默认是查不到的,因为它的数据库默认是每天自动更新一次。如果希望查询到当天创建的新文件,需要执行 updatedb 即可。

查找速度快是 locate 的优势,但它的缺点也非常明显:

  • 模糊查询
  • 查找匹配模式单一
  • 查询的名称匹配路径命令
  • 索引表的建立会占用磁盘空间
  • 非实时查询,当天数据可能查不到

好了,到这里关于 find 命令的全部内容已经结束,希望文中的案例和总结能够帮助你更好的使用它。同时也强烈建议收藏本文,以作为 Linux 常用命令手册。

相关推荐

pyproject.toml到底是什么东西?(py trim)

最近,在Twitter上有一个Python项目的维护者,他的项目因为构建失败而出现了一些bug(这个特别的项目不提供wheel,只提供sdist)。最终,发现这个bug是由于这个项目使用了一个pypr...

BDP服务平台SDK for Python3发布(bdp数据平台)

下载地址https://github.com/imysm/opends-sdk-python3.git说明最近在开发和bdp平台有关的项目,用到了bdp的python的sdk,但是官方是基于p...

Python-for-Android (p4a):(python-for-android p4a windows)

一、Python-for-Android(p4a)简介Python-for-Android(p4a),一个强大的开发工具,能够将你的Python应用程序打包成可在Android设备上运行...

Qt for Python—Qt Designer 概览

前言本系列第三篇文章(QtforPython学习笔记—应用程序初探)、第四篇文章(QtforPython学习笔记—应用程序再探)中均是使用纯代码方式来开发PySide6GUI应用程序...

Python:判断质数(jmu-python-判断质数)

#Python:判断质数defisPrime(n):foriinrange(2,n):ifn%i==0:return0re...

为什么那么多人讨厌Python(为什么python这么难)

Python那么棒,为什么那么多人讨厌它呢?我整理了一下,主要有这些原因:用缩进替代大括号许多人抱怨Python完全依赖于缩进来创建代码块,代码多一点就很难看到函数在哪里结束,那么你就需要把一个函数拆...

一文了解 Python 中带有 else 的循环语句 for-else/while-else

在本文中,我们将向您介绍如何在python中使用带有else的for/while循环语句。可能许多人对循环和else一起使用感到困惑,因为在if-else选择结构中else正常...

python的numpy向量化语句为什么会比for快?

我们先来看看,python之类语言的for循环,和其它语言相比,额外付出了什么。我们知道,python是解释执行的。举例来说,执行x=1234+5678,对编译型语言,是从内存读入两个shor...

开眼界!Python遍历文件可以这样做

来源:【公众号】Python技术Python对于文件夹或者文件的遍历一般有两种操作方法,一种是至二级利用其封装好的walk方法操作:import osfor root,d...

告别简单format()!Python Formatter类让你的代码更专业

Python中Formatter类是string模块中的一个重要类,它实现了Python字符串格式化的底层机制,允许开发者创建自定义的格式化行为。通过深入理解Formatter类的工作原理和使用方法,...

python学习——038如何将for循环改写成列表推导式

在Python里,列表推导式是一种能够简洁生成列表的表达式,可用于替换普通的for循环。下面是列表推导式的基本语法和常见应用场景。基本语法result=[]foriteminite...

详谈for循环和while循环的区别(for循环语句与while循环语句有什么区别)

初九,潜龙勿用在刚开始使用python循环语句时,经常会遇到for循环和while循环的混用,不清楚该如何选择;今天就对这2个循环语句做深入的分析,让大家更好地了解这2个循环语句以方便后续学习的加深。...

Python编程基础:循环结构for和while

Python中的循环结构包括两个,一是遍历循环(for循环),一是条件循环(while循环)。遍历循环遍历循环(for循环)会挨个访问序列或可迭代对象的元素,并执行里面的代码块。foriinra...

学习编程第154天 python编程 for循环输出菱形图

今天学习的是刘金玉老师零基础Python教程第38期,主要内容是python编程for循环输出菱形※。(一)利用for循环输出菱形形状的*号图形1.思路:将菱形分解为上下两个部分三角形图案,分别利用...

python 10个堪称完美的for循环实践

在Python中,for循环的高效使用能显著提升代码性能和可读性。以下是10个堪称完美的for循环实践,涵盖数据处理、算法优化和Pythonic编程风格:1.遍历列表同时获取索引(enumerate...