如何避免 Go 命令行执行产生“孤儿”进程?
bigegpt 2024-10-29 12:57 5 浏览
在 Go 程序当中,如果我们要执行命令时,通常会使用 exec.Command ,也比较好用,通常状况下,可以达到我们的目的,如果我们逻辑当中,需要终止这个进程,则可以快速使用 cmd.Process.Kill() 方法来结束进程。但当我们要执行的命令会启动其他子进程来操作的时候,会发生什么情况?
一 孤儿进程的产生
测试小程序:
func kill(cmd *exec.Cmd) func() {
return func() {
if cmd != nil {
cmd.Process.Kill()
}
}
}
func main() {
cmd := exec.Command("/bin/bash", "-c", "watch top >top.log")
time.AfterFunc(1*time.Second, kill(cmd))
err := cmd.Run()
fmt.Printf("pid=%d err=%s\n", cmd.Process.Pid, err)
}
执行小程序:
go run main.go
pid=27326 err=signal: killed
查看进程信息:
ps -j
USER PID PPID PGID SESS JOBC STAT TT TIME COMMAND
king 24324 1 24303 0 0 S s012 0:00.01 watch top
可以看到这个 "watch top" 的 PPID 为 1,说明这个进程已经变成了 “孤儿” 进程。
那为什么会这样,这并不符合我们预期,那么可以从 Go 的文档中找到答案:
二 通过进程组来解决掉所有子进程
在 linux 当中,是有会话、进程组和进程组的概念,并且 Go 也是使用 linux 的 kill(2) 方法来发送信号的,那么是否可以通过 kill 来将要结束进程的子进程都结束掉?
linux 的 kill(2) 的定义如下:
并在方法的描述中,可以看到如下内容:
如果 pid 为正数的时候,会给指定的 pid 发送 sig 信号,如果 pid 为负数的时候,会给这个进程组发送 sig 信号,那么我们可以通过进程组来将所有子进程退出掉?改一下 Go 程序中 kill 方法:
func kill(cmd *exec.Cmd) func() {
return func() {
if cmd != nil {
// cmd.Process.Kill()
syscall.Kill(-cmd.Process.Pid, syscall.SIGKILL)
}
}
}
func main() {
cmd := exec.Command("/bin/bash", "-c", "watch top >top.log")
time.AfterFunc(1*time.Second, kill(cmd))
err := cmd.Run()
fmt.Printf("pid=%d err=%s\n", cmd.Process.Pid, err)
}
再次执行:
go run main.go
会发现程序卡住了,我们来看一下当前执行的进程:
ps -j
USER PID PPID PGID SESS JOBC STAT TT TIME COMMAND
king 27655 91597 27655 0 1 S+ s012 0:01.10 go run main.go
king 27672 27655 27655 0 1 S+ s012 0:00.03 ..../exe/main
king 27673 27672 27655 0 1 S+ s012 0:00.00 /bin/bash -c watch top >top.log
king 27674 27673 27655 0 1 S+ s012 0:00.01 watch top
可以看到我们 go run 产生了一个子进程 27672(command 那里是 go 执行的临时目录,比较长,因此添加了省略号),27672 产生了 27673(watch top >top.log)进程,27673 产生了 27674(watch top)进程。那为什么没有将这些子进程都关闭掉呢?
其实之类犯了一个低级错误,从上图中,我们可以看到他们的进程组 ID 为 27655,但是我们传递的是 cmd 的 id 即 27673,这个并不是进程组的 ID,因此程序并没有 kill,导致 cmd.Run() 一直在执行。
在 Linux 中,进程组中的第一个进程,被称为进程组 Leader,同时这个进程组的 ID 就是这个进程的 ID,从这个进程中创建的其他进程,都会继承这个进程的进程组和会话信息;从上面可以看出 go run main.go 程序 PID 和 PGID 同为 27655,那么这个进程就是进程组 Leader,我们不能 kill 这个进程组,除非想“自杀”,哈哈哈。
那么我们给要执行的进程,新建一个进程组,在 Kill 不就可以了嘛。在 linux 当中,通过 setpgid 方法来设置进程组 ID,定义如下:
如果将 pid 和 pgid 同时设置成 0,也就是 setpgid(0,0),则会使用当前进程为进程组 leader 并创建新的进程组。
那么在 Go 程序中,可以通过 cmd.SysProcAttr 来设置创建新的进程组,修改后的代码如下:
func kill(cmd *exec.Cmd) func() {
return func() {
if cmd != nil {
// cmd.Process.Kill()
syscall.Kill(-cmd.Process.Pid, syscall.SIGKILL)
}
}
}
func main() {
cmd := exec.Command("/bin/bash", "-c", "watch top >top.log")
cmd.SysProcAttr = &syscall.SysProcAttr{
Setpgid: true,
}
time.AfterFunc(1*time.Second, kill(cmd))
err := cmd.Run()
fmt.Printf("pid=%d err=%s\n", cmd.Process.Pid, err)
}
再次执行:
go run main.go
pid=29397 err=signal: killed
再次查看进程:
ps -j
USER PID PPID PGID SESS JOBC STAT TT TIME COMMAND
发现 watch 的进程都不存在了,那我们在看看是否还会有孤儿进程:
# 由于我测试的环境是mac,因此这个脚本只能在mac执行
ps -j | head -1;ps -j | awk '{if ($3 ==1 && $1 !="root"){print $0}}' | head
USER PID PPID PGID SESS JOBC STAT TT TIME COMMAND
已经没有孤儿进程了,问题至此已经完全解决。
三 子进程监听父进程是否退出(只能在 linux 下执行)
假设要调用的程序也是我们自己写的其他应用程序,那么可以使用 Linux 的 prctl 方法来处理, prctl 方法的定义如下:
这个方法有一个重要的 option:PR_SET_PDEATHSIG,通过这个来接收父进程的退出。
让我们来再次构造一个有问题的程序。
有两个文件,分别为 main.go 和 child.go 文件,main.go 会调用 child.go 文件。
main.go 文件:
package main
import (
"os/exec"
)
func main() {
cmd := exec.Command("./child")
cmd.Run()
}
child.go 文件:
package main
import (
"fmt"
"time"
)
func main() {
for {
time.Sleep(200 * time.Millisecond)
fmt.Println(time.Now())
}
}
在 Linux 环境中分别编译这两个文件:
// 编译 main.go 生成 main 二进制文件
go build -o main main.go
// 编译 child.go 生成 child 二进制文件
go build -o child child.go
执行 main 二进制文件:
./main &
查看他们的进程:
ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 06:05 pts/0 00:00:00 /bin/bash
root 11514 1 0 12:12 pts/0 00:00:00 ./main
root 11520 11514 0 12:12 pts/0 00:00:00 ./child
可以看到 main 和 child 的进程,child 是 main 的子进程,我们将 main 进程 kill 掉,在查看进程状态:
kill -9 11514
ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 06:05 pts/0 00:00:00 /bin/bash
root 11520 1 0 12:12 pts/0 00:00:00 ./child
我们可以看到 child 的进程,他的 PPID 已经变成了 1,说明这个进程已经变成了孤儿进程。
那接下来我们可以使用 PR_SET_PDEATHSIG 来保证父进程退出,子进程也退出,大致方式有两种:使用 CGO 调用和使用 syscall.RawSyscall 来调用。
1 使用 CGO
将 child 修改成如下内容:
程序中,使用 CGO,为了简单的展示,在 Go 文件中编写了 C 的 killTest 方法,并调用了 prctl 方法,然后在 Go 程序中调用 killTest 方法,让我们重新编译执行一下,再看看进程:
go build -o child child.go
./main &
ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 06:05 pts/0 00:00:00 /bin/bash
root 11663 1 0 12:28 pts/0 00:00:00 ./main
root 11669 11663 0 12:28 pts/0 00:00:00 ./child
再次 kill 掉 main,并查看进程:
kill -9 11663
ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 06:05 pts/0 00:00:00 /bin/bash
可以看到 child 的进程也已经退出了,说明 CGO 调用的 prctl 生效了。
2 syscall.RawSyscall 方法
也可以采用 Go 中提供的 syscall.RawSyscall 方法来替代调用 CGO,在 Go 的文档中,可以查看到 syscall 包中定义的常量(查看 linux,如果是本地 godoc,需要指定 GOOS=linux),可以看到我们要用的几个常量以及他们对应的数值:
// 其他内容省略掉了
const(
....
PR_SET_PDEATHSIG = 0x1
....
)
const(
.....
SYS_PRCTL = 157
.....
)
其中 PR_SET_PDEATHSIG 操作的值为 1,SYS_PRCTL 的值为 157,那么将 child.go 修改成如下内容:
package main
import (
"fmt"
"os"
"syscall"
"time"
)
func main() {
_, _, errno := syscall.RawSyscall(uintptr(syscall.SYS_PRCTL), uintptr(syscall.PR_SET_PDEATHSIG), uintptr(syscall.SIGKILL), 0)
if errno != 0 {
os.Exit(int(errno))
}
for {
time.Sleep(200 * time.Millisecond)
fmt.Println(time.Now())
}
}
再次编译并执行:
go build -o child child.go
./main &
ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 06:05 pts/0 00:00:00 /bin/bash
root 12208 1 0 12:46 pts/0 00:00:00 ./main
root 12214 12208 0 12:46 pts/0 00:00:00 ./child
将 main 进程结束掉:
kill -9 12208
ps -ef
UID PID PPID C STIME TTY TIME CMD
root 1 0 0 06:05 pts/0 00:00:00 /bin/bash
child 进程已经退出了,也达成了最终效果。
四 总结
当我们使用 Go 程序执行其他程序的时候,如果其他程序也开启了其他进程,那么在 kill 的时候可能会把这些进程变成孤儿进程,一直执行并滞留在内存中。当然,如果我们程序非法退出,或者被 kill 调用,也会导致我们执行的进程变成孤儿进程,那么为了解决这个问题,从两个思路来解决:
- 给要执行的程序创建新的进程组,并调用 syscall.Kill,传递负值 pid 来关闭这个进程组中所有的进程(比较完美的解决方法)。
- 如果要调用的程序也是我们自己编写的,那么可以使用 PR_SET_PDEATHSIG 来感知父进程退出,那么这种方式需要调用 Linxu 的 prctrl,可以使用 CGO 的方式,也可以使用 syscall.RawSyscall 的方式。
但不管使用哪种方式,都只是提供了一种思路,在我们编写服务端服务程序的时候,需要特殊关注,防止孤儿进程消耗服务器资源。
作者 | 昕希
原文链接:http://click.aliyun.com/m/1000289494/
本文为阿里云原创内容,未经允许不得转载。
相关推荐
- 悠悠万事,吃饭为大(悠悠万事吃饭为大,什么意思)
-
新媒体编辑:杜岷赵蕾初审:程秀娟审核:汤小俊审签:周星...
- 高铁扒门事件升级版!婚宴上‘冲喜’老人团:我们抢的是社会资源
-
凌晨两点改方案时,突然收到婚庆团队发来的视频——胶东某酒店宴会厅,三个穿大红棉袄的中年妇女跟敢死队似的往前冲,眼瞅着就要扑到新娘的高额钻石项链上。要不是门口小伙及时阻拦,这婚礼造型团队熬了三个月的方案...
- 微服务架构实战:商家管理后台与sso设计,SSO客户端设计
-
SSO客户端设计下面通过模块merchant-security对SSO客户端安全认证部分的实现进行封装,以便各个接入SSO的客户端应用进行引用。安全认证的项目管理配置SSO客户端安全认证的项目管理使...
- 还在为 Spring Boot 配置类加载机制困惑?一文为你彻底解惑
-
在当今微服务架构盛行、项目复杂度不断攀升的开发环境下,SpringBoot作为Java后端开发的主流框架,无疑是我们手中的得力武器。然而,当我们在享受其自动配置带来的便捷时,是否曾被配置类加载...
- Seata源码—6.Seata AT模式的数据源代理二
-
大纲1.Seata的Resource资源接口源码2.Seata数据源连接池代理的实现源码3.Client向Server发起注册RM的源码4.Client向Server注册RM时的交互源码5.数据源连接...
- 30分钟了解K8S(30分钟了解微积分)
-
微服务演进方向o面向分布式设计(Distribution):容器、微服务、API驱动的开发;o面向配置设计(Configuration):一个镜像,多个环境配置;o面向韧性设计(Resista...
- SpringBoot条件化配置(@Conditional)全面解析与实战指南
-
一、条件化配置基础概念1.1什么是条件化配置条件化配置是Spring框架提供的一种基于特定条件来决定是否注册Bean或加载配置的机制。在SpringBoot中,这一机制通过@Conditional...
- 一招解决所有依赖冲突(克服依赖)
-
背景介绍最近遇到了这样一个问题,我们有一个jar包common-tool,作为基础工具包,被各个项目在引用。突然某一天发现日志很多报错。一看是NoSuchMethodError,意思是Dis...
- 你读过Mybatis的源码?说说它用到了几种设计模式
-
学习设计模式时,很多人都有类似的困扰——明明概念背得滚瓜烂熟,一到写代码就完全想不起来怎么用。就像学了一堆游泳技巧,却从没下过水实践,很难真正掌握。其实理解一个知识点,就像看立体模型,单角度观察总...
- golang对接阿里云私有Bucket上传图片、授权访问图片
-
1、为什么要设置私有bucket公共读写:互联网上任何用户都可以对该Bucket内的文件进行访问,并且向该Bucket写入数据。这有可能造成您数据的外泄以及费用激增,若被人恶意写入违法信息还可...
- spring中的资源的加载(spring加载原理)
-
最近在网上看到有人问@ContextConfiguration("classpath:/bean.xml")中除了classpath这种还有其他的写法么,看他的意思是想从本地文件...
- Android资源使用(android资源文件)
-
Android资源管理机制在Android的开发中,需要使用到各式各样的资源,这些资源往往是一些静态资源,比如位图,颜色,布局定义,用户界面使用到的字符串,动画等。这些资源统统放在项目的res/独立子...
- 如何深度理解mybatis?(如何深度理解康乐服务质量管理的5个维度)
-
深度自定义mybatis回顾mybatis的操作的核心步骤编写核心类SqlSessionFacotryBuild进行解析配置文件深度分析解析SqlSessionFacotryBuild干的核心工作编写...
- @Autowired与@Resource原理知识点详解
-
springIOCAOP的不多做赘述了,说下IOC:SpringIOC解决的是对象管理和对象依赖的问题,IOC容器可以理解为一个对象工厂,我们都把该对象交给工厂,工厂管理这些对象的创建以及依赖关系...
- java的redis连接工具篇(java redis client)
-
在Java里,有不少用于连接Redis的工具,下面为你介绍一些主流的工具及其特点:JedisJedis是Redis官方推荐的Java连接工具,它提供了全面的Redis命令支持,且...
- 一周热门
- 最近发表
- 标签列表
-
- mybatiscollection (79)
- mqtt服务器 (88)
- keyerror (78)
- c#map (65)
- resize函数 (64)
- xftp6 (83)
- bt搜索 (75)
- c#var (76)
- mybatis大于等于 (64)
- xcode-select (66)
- mysql授权 (74)
- 下载测试 (70)
- linuxlink (65)
- pythonwget (67)
- androidinclude (65)
- logstashinput (65)
- hadoop端口 (65)
- vue阻止冒泡 (67)
- oracle时间戳转换日期 (64)
- jquery跨域 (68)
- php写入文件 (73)
- kafkatools (66)
- mysql导出数据库 (66)
- jquery鼠标移入移出 (71)
- 取小数点后两位的函数 (73)