百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 热门文章 > 正文

原来批量重命名文件shell里有这么多讲究

bigegpt 2024-11-01 11:18 4 浏览

根据您可用的非标准工具的不同,有许多不同的方法可以实现这一目标。即使只使用标准的 POSIX 工具,您仍然可以执行大多数简单的情况。我们先展示可移植工具的示例。

您可以使用循环和一些参数扩展来执行大多数非递归的批量重命名,示例如下:

# POSIX
# 将所有的*.foo重命名为*.bar
for f in *.foo; do mv -- "$f" "${f%.foo}.bar"; done

要在实际执行之前检查命令会做什么,可以在 mv 之前添加 echo。这适用于本页上几乎所有的示例,因此我们不再重复提及。

# POSIX
# 这将从所有文件中删除扩展名.zip。
for file in ./*.zip; do mv "$file" "${file%.zip}"; done

"--" 和 "./*" 用于防止以 "-" 开头的问题文件名。您只需要其中一个,不需要同时使用两个,选择您喜欢的即可。

以下是使用 Bash 特定的参数扩展的一些类似示例:

# Bash
# 将所有的空格替换为下划线
for f in *\ *; do mv -- "$f" "${f// /_}"; done

有关处理文件名中不方便字符的更多技巧,请参阅 FAQ#20。

# Bash
# 将 "foo" 替换为 "bar",即使它不是扩展名
for file in ./*foo*; do mv "$file" "${file//foo/bar}"; done

以上所有示例都为每个文件调用一次外部命令 mv(1),因此它们可能不像某些非标准实现那样高效。

递归重命名文件

如果您想要递归地重命名文件,这将变得更具挑战性。以下示例演示了如何将所有*.foo文件递归重命名为*.bar:

# Bash
# 还需要GNU或BSD的find(1)
# 递归地将所有*.foo文件更改为*.bar

find . -type f -name '*.foo' -print0 | while IFS= read -r -d '' f; do
  mv -- "$f" "${f%.foo}.bar"
done

此示例使用Bash 4的globstar?而不是GNU find:

# Bash 4
# 递归地将所有文件中的"foo"替换为"bar"。
# "foo"不能出现在目录名中!

shopt -s globstar
for file in /path/to/**/*foo*; do
    mv -- "$file" "${file//foo/bar}"
done

递归重命名最棘手的部分是确保您不会更改路径名的目录部分,因为像这样的操作注定会失败:

mv "./FOO/BAR/FILE.TXT" "./foo/bar/file.txt"

因此,任何递归重命名命令都应仅更改每个路径名的文件名部分,如下所示:

mv "./FOO/BAR/FILE.TXT" "./FOO/BAR/file.txt"

如果您还需要重命名目录,应该单独进行。此外,递归目录重命名应该以深度优先(仅在每个实例中更改目录名的最后组件)或多次进行。在一般情况下,深度优先效果更好。

以下是一个使用深度优先递归的示例脚本(将名称中的空格转换为下划线,但您只需要更改ren()?函数来执行您想要的任何操作),以重命名文件和目录。同样,可以轻松修改它,使其仅在文件或仅在目录上执行操作,或者仅在具有特定扩展名的文件上执行操作,以避免或强制覆盖文件等等:

# Bash
ren() {
  local newname
  newname=${1// /_}
  [[ $1 != "$newname" ]] && mv -- "$1" "$newname"
}

traverse() {
  local file
  cd -- "$1" || exit
  for file in *; do
    [[ -d $file ]] && traverse "$file"
    ren "$file"
  done
  cd .. || exit
}

# 主程序
shopt -s nullglob dotglob
traverse /path/to/startdir

另一种递归重命名所有包含空格的目录和文件的方法:

find . -depth -name "* *" -exec bash -c 'dir=${1%/*} base=${1##*/}; mv "$1" "$dir/${base// /_}"' _ {} \;

或者,如果您的find版本支持,以下方式更高效,因为它一次运行一个bash而不是每个文件运行一个bash:

find . -depth -name "* *" -exec bash -c 'for f; do dir=${f%/*} base=${f##*/}; mv "$f" "$dir/${base//空格转换为下划线}"; done' _ {} +

大写和小写

要使用标准工具将文件名转换为小写,您需要能够接受混合大小写的文件名作为输入,并将其转换为小写版本作为输出。在Bash 4及更高版本中,有一种参数展开的方法可以实现:

# Bash 4
for f in *[[:upper:]]*; do mv -- "$f" "${f,,}"; done

否则,tr(1)可能会有所帮助:

# tolower - 将文件名转换为小写
# POSIX
for file do
    [ -f "$file" ] || continue                # 忽略不存在的文件名
    newname=$(printf %s "$file" | tr '[:upper:]' '[:lower:]')     # 转换为小写
    [ "$file" = "$newname" ] && continue      # 无需操作
    [ -f "$newname" ] && continue             # 不要覆盖现有文件
    mv -- "$file" "$newname"
done

这个示例将无法处理以换行符结尾的文件名,因为CommandSubstitution会将其吞掉。解决这个问题的方法是在命令替换中附加一个字符,然后在之后将其删除。例如:

newname=$(printf %sx "$file" | tr '[:upper:]' '[:lower:]')
newname=${newname%x}

我们使用了高级范围表示法,因为在某些locales上,tr在使用A-Z范围时可能会表现得非常奇怪:

imadev:~$ echo Hello | tr A-Z a-z
héMMó

为了确保在使用范围时不会遇到意外情况,要么使用高级范围表示法,要么将区域设置为C。

imadev:~$ echo Hello | LC_ALL=C tr A-Z a-z
hello
imadev:~$ echo Hello | tr '[:upper:]' '[:lower:]'
hello
# 这两种方法都可以。

请注意,GNU tr不支持多字节字符(如非ASCII UTF-8字符)。因此,在GNU系统上,您可能更喜欢使用:

# GNU
sed 's/.*/\L&/g'
# POSIX
awk '{print tolower($0)}'

这种技术也可用于替换文件名中的所有不需要的字符,例如使用'_'(下划线)。脚本与上面的示例相同,只需更改"newname=..."这一行即可。

# renamefiles - 重命名文件名包含异常字符的文件
# POSIX
for file do
    [ -f "$file" ] || continue            # 忽略非常规文件等
    newname=$(printf '%s\n' "$file" | sed 's/[^[:alnum:]_.]/_/g' | paste -sd _ -)
    [ "$file" = "$newname" ] && continue  # 无需操作
    [ -f "$newname" ] && continue         # 不要覆盖现有文件
    mv -- "$file" "$newname"
done

方括号[]中的字符类包含我们要保留的所有字符(^后面的字符);根据需要进行修改。[:alnum:]范围表示当前区域设置的所有字母和数字。但请注意,它不会替换不构成有效字符的字节(如使用错误字符集编码的字符)。

以下是一个修改后的示例,使用参数展开代替sed:

# renamefiles(更高效、不太便携的版本)
# Bash/Ksh/Zsh
for file in "$@"; do
   [[ -f "$file" ]] || continue
   newname=${file//[![:alnum:]_.]/_}
   [[ "$file" = "$newname" ]] && continue
   [[ -e "$newname" ]] && continue
   [[ -L "$newname" ]] && continue
   mv -- "$file" "$newname"
done

需要注意的是,所有这些示例都涉及到竞态条件。如果在[ -e "$newname" ...?和mv "$file" ...?之间创建了一个现有文件,那么该文件可能会被覆盖。解决此问题超出了本页面的范围,但可以通过为mv命令添加-i?选项和(GNU特定的)-T?选项来减轻其影响。

最后,关于更改文件名大小写的说明:在使用GNU mv时,在许多文件系统上,尝试将文件重命名为其小写或大写等效名称可能会失败。(例如,在使用FAT或NTFS文件系统的DOS/Windows系统上的Cygwin,以及在使用HFS+处于不区分大小写模式的Mac OS X系统上的GNU mv。还有在挂载了Windows/Mac文件系统的Linux系统上,以及可能是其他许多设置。)GNU mv在尝试重命名之前会检查目标名称,并且由于文件系统的映射,它认为目标“已经存在”:

mv README Readme    # 在FAT文件系统等上使用GNU mv会失败

解决此问题的方法是将文件重命名两次:首先将其重命名为与原始名称完全不同的临时名称,然后再重命名为所需名称。

mv README tempfilename &&
mv tempfilename Readme

非标准工具

如果您的计算机上安装了mmv(1)实用程序,您可以使用以下命令将文件名转换为小写:

# 将所有文件名转换为小写
mmv "*" "#l1"

一些GNU/Linux发行版提供了rename(1)命令,但语法在不同的发行版之间有所差异。Debian使用perl rename脚本(以前包含在Perl中,现在不再包含),将其安装为prename(1)和rename(1)。Red Hat使用完全不同的rename(1)命令。

prename脚本非常灵活。例如,可以用它来将文件名转换为小写:

# 将所有文件名转换为小写
prename '$_=lc($_)' ./*

或者也可以使用:

# 将所有文件名转换为小写
prename 'y/A-Z/a-z/' ./*

如果要让prename在处理UTF-8编码的文件时使用Unicode而不是ASCII:

# 使用Unicode规则将所有文件名转换为小写
PERL_UNICODE=SA rename '$_=lc' ./*

要使用当前locale字符集对文件名进行操作:

rename 'BEGIN{use Encode::Locale qw(decode_argv);decode_argv} $_=lc'

(请注意,它仍然不会使用locale的大小写转换规则。例如,在土耳其语环境中,I将被转换为?,而不是i)。

或者递归地进行操作:

# 递归地将所有文件名转换为小写(假设find实现支持非标准的-execdir谓词)
#
# 注意:这不会更改目录名。这是因为-execdir在运行命令之前会将当前目录更改为父目录。这意味着尽管有+,但每个文件重命名都会执行一个prename命令。
find . -type f -name '*[[:upper:]]*' -execdir prename '$_=lc($_)' {} +

更高效和可移植的方法:

find . -type f -name '*[[:upper:]]*' -exec prename 's{[^/]*$}{lc()}e' {} +

或者将所有下划线替换为空格:

prename 's/_/ /g' ./*_*

使用$EDITOR(来自moreutils)以交互方式重命名文件:

vidir

或者递归地进行操作:

find . -type f | vidir -

(注意:vidir无法处理文件名中包含换行符的情况。)

更多

如果您觉得文章内容对你有一点帮助可以关注我,我在头条平台会持续分享更多实用的shell技巧和最佳实践,如果想系统的快速学习shell的各种高阶用法和生产环境避坑指南可以看看《shell脚本编程最佳实践》专栏,专栏里有更多的实用小技巧和脚本代码分享。

相关推荐

悠悠万事,吃饭为大(悠悠万事吃饭为大,什么意思)

新媒体编辑:杜岷赵蕾初审:程秀娟审核:汤小俊审签:周星...

高铁扒门事件升级版!婚宴上‘冲喜’老人团:我们抢的是社会资源

凌晨两点改方案时,突然收到婚庆团队发来的视频——胶东某酒店宴会厅,三个穿大红棉袄的中年妇女跟敢死队似的往前冲,眼瞅着就要扑到新娘的高额钻石项链上。要不是门口小伙及时阻拦,这婚礼造型团队熬了三个月的方案...

微服务架构实战:商家管理后台与sso设计,SSO客户端设计

SSO客户端设计下面通过模块merchant-security对SSO客户端安全认证部分的实现进行封装,以便各个接入SSO的客户端应用进行引用。安全认证的项目管理配置SSO客户端安全认证的项目管理使...

还在为 Spring Boot 配置类加载机制困惑?一文为你彻底解惑

在当今微服务架构盛行、项目复杂度不断攀升的开发环境下,SpringBoot作为Java后端开发的主流框架,无疑是我们手中的得力武器。然而,当我们在享受其自动配置带来的便捷时,是否曾被配置类加载...

Seata源码—6.Seata AT模式的数据源代理二

大纲1.Seata的Resource资源接口源码2.Seata数据源连接池代理的实现源码3.Client向Server发起注册RM的源码4.Client向Server注册RM时的交互源码5.数据源连接...

30分钟了解K8S(30分钟了解微积分)

微服务演进方向o面向分布式设计(Distribution):容器、微服务、API驱动的开发;o面向配置设计(Configuration):一个镜像,多个环境配置;o面向韧性设计(Resista...

SpringBoot条件化配置(@Conditional)全面解析与实战指南

一、条件化配置基础概念1.1什么是条件化配置条件化配置是Spring框架提供的一种基于特定条件来决定是否注册Bean或加载配置的机制。在SpringBoot中,这一机制通过@Conditional...

一招解决所有依赖冲突(克服依赖)

背景介绍最近遇到了这样一个问题,我们有一个jar包common-tool,作为基础工具包,被各个项目在引用。突然某一天发现日志很多报错。一看是NoSuchMethodError,意思是Dis...

你读过Mybatis的源码?说说它用到了几种设计模式

学习设计模式时,很多人都有类似的困扰——明明概念背得滚瓜烂熟,一到写代码就完全想不起来怎么用。就像学了一堆游泳技巧,却从没下过水实践,很难真正掌握。其实理解一个知识点,就像看立体模型,单角度观察总...

golang对接阿里云私有Bucket上传图片、授权访问图片

1、为什么要设置私有bucket公共读写:互联网上任何用户都可以对该Bucket内的文件进行访问,并且向该Bucket写入数据。这有可能造成您数据的外泄以及费用激增,若被人恶意写入违法信息还可...

spring中的资源的加载(spring加载原理)

最近在网上看到有人问@ContextConfiguration("classpath:/bean.xml")中除了classpath这种还有其他的写法么,看他的意思是想从本地文件...

Android资源使用(android资源文件)

Android资源管理机制在Android的开发中,需要使用到各式各样的资源,这些资源往往是一些静态资源,比如位图,颜色,布局定义,用户界面使用到的字符串,动画等。这些资源统统放在项目的res/独立子...

如何深度理解mybatis?(如何深度理解康乐服务质量管理的5个维度)

深度自定义mybatis回顾mybatis的操作的核心步骤编写核心类SqlSessionFacotryBuild进行解析配置文件深度分析解析SqlSessionFacotryBuild干的核心工作编写...

@Autowired与@Resource原理知识点详解

springIOCAOP的不多做赘述了,说下IOC:SpringIOC解决的是对象管理和对象依赖的问题,IOC容器可以理解为一个对象工厂,我们都把该对象交给工厂,工厂管理这些对象的创建以及依赖关系...

java的redis连接工具篇(java redis client)

在Java里,有不少用于连接Redis的工具,下面为你介绍一些主流的工具及其特点:JedisJedis是Redis官方推荐的Java连接工具,它提供了全面的Redis命令支持,且...