Linux 高级编程 - 信号 Signal
版权声明:本文为 DLonng 原创文章,可以随意转载,但必须在明确位置注明出处!
信号(Signal)简介
软中断信号 Signal
,简称信号,用来通知进程发生了异步事件,进程之间可以互相通过系统调用 kill
等函数来发送软中断信号。内核也可以因为内部事件而给进程发送信号,通知进程发生了某个事件,但是要注意信号只是用来通知进程发生了什么事件,并不给该进程传递任何数据,例如终端用户键入中断键,会通过信号机制停止当前程序。
Linux 中每个信号都有一个以 SIG
开头的名字,例如 (终止信号)SIGINT,退出信号(SIGABRT),信号定义在 bits/signum.h
头文件中,每个信号都被定义成整数常量。
一些重要的信号概念
信号是许多重要的应用程序都需要使用的技术,有些非常重要的概念我们必须了解。
信号处理的 3 个过程
信号处理有 3 个过程:
- 发送信号:有发送信号的函数
- 接收信号:有接受信号的函数
- 处理信号:有处理信号的函数
信号处理的 3 种方式
在某个信号出现时,可以告诉内核按照下面 3 种方式之一来处理:
- 忽略此信号:大多数信号都可以忽略,但是
SIGKILL
和SIGSTOP
不能忽略 - 捕捉信号:通知内核在某种信号发生时,调用用户的函数来处理事件
- 执行系统默认动作:大多数信号的系统默认动作是终止改进程,使用
man 7 signal
查看默认动作
常用信号
信号有很多种,可以使用 kill - l
列出系统支持的信号:
kill -l
# 结果
1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP
6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1
11) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM
16) SIGSTKFLT 17) SIGCHLD 18) SIGCONT 19) SIGSTOP 20) SIGTSTP
21) SIGTTIN 22) SIGTTOU 23) SIGURG 24) SIGXCPU 25) SIGXFSZ
26) SIGVTALRM 27) SIGPROF 28) SIGWINCH 29) SIGIO 30) SIGPWR
31) SIGSYS 34) SIGRTMIN 35) SIGRTMIN+1 36) SIGRTMIN+2 37) SIGRTMIN+3
38) SIGRTMIN+4 39) SIGRTMIN+5 40) SIGRTMIN+6 41) SIGRTMIN+7 42) SIGRTMIN+8
43) SIGRTMIN+9 44) SIGRTMIN+10 45) SIGRTMIN+11 46) SIGRTMIN+12 47) SIGRTMIN+13
48) SIGRTMIN+14 49) SIGRTMIN+15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12
53) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9 56) SIGRTMAX-8 57) SIGRTMAX-7
58) SIGRTMAX-6 59) SIGRTMAX-5 60) SIGRTMAX-4 61) SIGRTMAX-3 62) SIGRTMAX-2
63) SIGRTMAX-1 64) SIGRTMAX
这么多的信号也不可能都记得很清楚,只需要知道常用的即可,常用的信号有下面这些:
SIGHUP
:终端结束信号SIGINT
:键盘中断信号(Ctrl - C)SIGQUIT
:键盘退出信号(Ctrl - \)SIGPIPE
:浮点异常信号SIGKILL
:用来结束进程的信号SIGALRM
:定时器信号SIGTERM
:kill 命令发出的信号SIGCHLD
:标识子进程结束的信号SIGSTOP
:停止执行信号(Ctrl - Z)
信号分类
信号也有 2 种分类:不可靠信号,可靠信号。
1. 不可靠信号
Linux 继承了早期 UNIX 的一些信号,这些信号有些缺陷:在发送给进程的时候可能会丢失,也称为不可靠信号,其中信号值小于 34) SIGRTMIN
都是不可靠信号。
2. 可靠信号
后来 Linux 改进了信号机制,增加了一些可靠信号:支持排队,信号不会丢失,34) SIGRTMIN - 64) SIGRTMIX
为可靠信号。
信号集合(signal set)
可以用信号集(Signal Set)来表示多个信号,例如可以用来告诉内核不允许发生该信号集中的信号。用 sigset_t
可以定义一个信号集,之后便可以用信号集操作函数来增加,删除特定的信号。
信号操作一:发送 Signal
发送信号多种方式,例如向进程本身发送信号,向其他进程发送信号,发送特殊信号,我们来一一学习。
向自身发送信号
调用 raise
来向当前进程或线程发送一个信号:
#include <signal.h>
/*
* sig:信号编号
* return:成功返回 0,失败返回非 0
*/
int raise(int sig);
我们来向当前进程发送 SIGKILL
或者 SIGSTOP
信号来结束它:
// test_raise.c
#include <stdio.h>
#include <signal.h>
int main() {
raise(SIGKILL);
//raise(SIGSTOP);
printf("process run ok\n");
return 0;
}
编译运行可以看到一启动就结束了:
# 发送 SIGKILL
Killed
# 发送 SIGSTOP
[1]+ Stopped ./raise
向别的进程发送信号
可以调用 kill
来向一个指定进程发送指定信号:
#include <sys/types.h>
#include <signal.h>
/*
* pid:进程 PID
* sig:信号编号
* return:成功返回 0,失败返回 -1
*/
int kill(pid_t pid, int sig);
我们来编写一个死循环程序,然后 kill
掉它:
// test_loop.c
#include <stdio.h>
#include <unistd.h>
int main() {
int x = 0;
while (1) {
x++;
sleep(1);
}
return 0;
}
编译运行它,生成可执行文件 loop
:
gcc test_loop.c -o loop
# 运行
./loop
然后查看 loop 进程 PID:
ps -aux | grep loop
# 我的输出
orange 18051 0.0 0.0 4212 688 pts/7 S+ 20:52 0:00 ./loop
查到 loop 进程的 PID = 18051
,下面来编写 kill 程序:
// kill_loop.c
#include <stdio.h>
#include <signal.h>
#include <sys/types.h>
int main() {
kill(18051, SIGKILL);
printf("Has kill\n");
return 0;
}
编译运行,即可看到 loop 被干掉了:
./loop
Killed
kill 使用起来也比较简单,再来看一个特殊的发送信号函数 alarm。
发送闹钟信号 alarm
可以使用 alarm
来定时 seconds
发送一个 SIGALRM
信号,该信号的默认动作是终止进程:
#include <unistd.h>
/*
* seconds:定时时间,如果为 0 则取消所有绑定的定时器
* return:返回闹钟的剩余时间,如果没有设置返回 0
*/
unsigned int alarm(unsigned int seconds);
我们来定时 3 s 然后终止当前进程:
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
int main() {
alarm(3);
while (1);
printf("main exit\n");
return 0;
}
编译运行,可以发现 3 s 后进程被终止:
./test_alarm
# 3 s 之后被终止
Alarm clock
信号操作二:接收(注册)信号
Linux 给我们提供下面这个 signal
函数来接收(注册)一个信号:
#include <signal.h>
typedef void (*sighandler_t)(int);
/*
* signum:要注册的信号编号
* handler:信号的处理函数
* return:???
*/
sighandler_t signal(int signum, sighandler_t handler);
这个函数的第二个参数和返回值都是 void (*)(int)
类型的函数指针,需要特别注意,目前不推荐使用这个函数了!目前推荐使用 sigaction
来注册,后面有介绍。
信号操作三:处理信号
处理信号又可以进一步分为忽略信号,默认处理,自定义处理。
屏蔽信号
如果在接收一个信号时设置 handler
为 SIG_IGN
则忽略这个信号,例如下面的代码忽略 SIGQUIT
信号:
signal(SIGQUIT, SIG_IGN);
缺省处理信号
通过在接受信号时设置 handler
为 SIG_DFL
缺省处理这个信号,信号的缺省处理方式取决于这个信号,可以查看 man 7 signal
中对信号默认处理方式的介绍。下面的代码在接收 SIGQUIT
信号时,采用系统的缺省处理方式:退出
signal(SIGQUIT, SIG_DFL);
老式信号处理 signal
通过指定我们自己编写的 void (*sighandler_t)(int)
类型的函数来自己处理一个信号:
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
// 信号处理函数
void sig_handler(int sig_no) {
if (SIGINT == sig_no)
printf("\nGet (Ctrl - C)SIGINT\n");
else if (SIGQUIT == sig_no)
printf("\nGet (Ctrl - \\)SIGQUIT\n");
else
;// do nothing...
}
int main() {
printf("wait for signal...\n");
// Ctrl - C
signal(SIGINT, sig_handler);
// Ctrl - '\'
signal(SIGQUIT, sig_handler);
pause();
return 0;
}
编译运行,当键入 Ctrl - C
和 Ctrl - \
时可以看到打印的提示信息:
# 测试 SIGINT
wait for signal...
^C
Get (Ctrl - C)SIGINT
# 测试 SIGQUIT
wait for signal...
^\
Get (Ctrl - \)SIGQUIT
重点:使用 sigaction 处理信号
sigaction
函数检查或修改与指定信号相关联的处理动作,这个函数取代了早期 UNIX 使用的 signal
函数,主要是因为早期的 UNIX 实现会在接收到一个信号后重置信号处理函数,现在推荐使用 sigaction
来进行信号处理,来看看它的定义:
#include <signal.h>
/*
* signum:信号编号
* act:如果非 NULL,则信号 signum 被安装到 act 中
* oldact:如果非 NULL,则旧的信号被保存到 oldact 中
* return:成功返回 0,失败返回 -1,并设置 erron
*/
int sigaction(int signum, const struct sigaction *act, struct sigaction *oldact);
// 用 sigaction 结构取代了单一的 sighandler_t 函数指针
struct sigaction {
void (*sa_handler)(int); // 信号处理函数
void (*sa_sigaction)(int, siginfo_t *, void *); // 另一种替代的信号处理函数
sigset_t sa_mask; // 指定了应该被阻塞的信号掩码
int sa_flags; // 指定一组修改信号行为的标志
void (*sa_restorer)(void); // 应用程序不是使用这个成员
};
我们用这种方法来重写上面的例子:
#include <stdio.h>
#include <unistd.h>
#include <signal.h>
#include <stdlib.h>
#include <string.h>
void sig_handler(int sig_no) {
if (SIGINT == sig_no)
printf("\nGet (Ctrl - C)SIGINT\n");
else if (SIGQUIT == sig_no)
printf("\nGet (Ctrl - \\)SIGQUIT\n");
else
;// do nothing...
}
int main() {
printf("wait for signal...\n");
struct sigaction act;
// 初始化信号结构
memset(&act, 0, sizeof(act));
// 设置信号处理函数
act.sa_handler = sig_handler;
// 注册 SIGINT 信号
if (sigaction(SIGINT, &act, NULL) < 0) {
perror("sigaction");
exit(1);
}
// 注册 SIGQUIT 信号
if (sigaction(SIGQUIT, &act, NULL) < 0) {
perror("sigaction");
exit(1);
}
pause();
return 0;
}
编译运行之后的效果跟使用 signal
是一样的。注意:在信号处理程序中要保证调用的函数都是可重入函数,即信号安全函数。什么是可重入函数?
可重入函数
一个可重入函数简单来说就是可以被中断的函数,可以在这个函数执行的任何时刻中断它让 CPU 去执行另外一段代码,而返回时不会出现任何错误;而不可重入的函数会由于使用了一些系统资源,比如全局变量区,中断向量表等,所以它如果被中断,返回可能会出现问题。
例如在信号处理函数中要注意:
- 不要使用带有全局静态数据结构的函数
- 不要调用 malloc 和 free
- 不要调用标准 IO 函数
最后再来了解下信号在内核中的基本实现原理,多学点没有坏处,学习技术了解点底层的原理可以加深理解,但不需要多精通。
拓展:Signal 在内核中的实现
Linux 的信号实际上是一个软件中断,内核中的原理还是比较复杂的,这里只是对信号的一个大体过程的介绍,帮助你更好的理解,而不是非要掌握内核中的实现原理。先来看看内核中信号的数据结构。
signal_struct
信号在内核中用 signal_struct
结构来表示:
// Linux 3.4: include/linux/sched.h
struct signal_struct { ... };
因为我们的信号是发送给进程的,所以进程的结构体中自然就包含了这个信号结构:
// Linux 3.4: include/linux/sched.h
struct task_struct {
...
/* signal handlers */
struct signal_struct *signal;
...
}
发送信号
一个 Send
进程发送信号给另外一个接受信号进程 Rec
的简要过程是:内核将要设置的发送的信号 sig
放到一个分配的信号队列 sigqueue
中,然后将这个队列加到要 Rec
进程的信号集 sigpending
链表中。之后在 Rec
进程触发下面 2 个状态时,内核检查信号并发送给 Rec
进程,然后 Rec
进程处理信号:
- 中断返回:进程被系统中断后,系统也会检查信号
- 系统调用返回:进程在系统调用后从内核态返回用户态时要检查信号
跟踪 kill
函数
我们以 kill 为例来跟踪 Linux 3.4
内核是如何发送一个信号的(不同的内核可能会有差异),我这里总体分为 12 个步骤:
发送信号的整个过程还是有点复杂的,但也都是大体的执行过程:
- 上层调用
kill
等发送信号的函数,并传递信号编号 sig,和 Rec 进程的 pid - 之后调用到内核中的
do_tkill
,仍然带有 Rec 进程的 pid - 继续调用
do_send_specific(pid)
- 继续调用
do_send_sig_info(pid)
- 在
do_send_sig_info(pid)
函数中根据pid
来查找 Rec 进程的进程结构体:task_struct p = find_task_by_vpid(pid);
- 继续调用
do_send_sig_info(p)
,注意这时传递的参数之一是进程结构体,不再是 pid 了 - 继续调用
send_signal(p)
- 继续调用
__send_signal(t = p)
,这也是最后一个函数了,这里将 p 改名为了 t,然后在这个函数中进行下面的步骤 9 - 12 - 得到 Rec 进程的信号集合链表
struct sigpending *pending = &t->pending
- 为要发送的信号 sig 分配信号队列
struct sigqueue *q = __sigqueue_alloc(sig)
- 将信号队列加到 Rec 进程的信号集合链表中
list_add_tail(&q->list, &pending->list);
- 初始化信号队列
这些发送信号的过程还有很多细节没有介绍,建议你实际跟踪 kernel/signal.c
,加深理解。
注册信号
这里分析 sigaction
函数的注册一个信号的过程:glibc 中的函数进行系统调用,将转换后的信号传递给内核,然后内核调用 do_sigaction
来将该信号从当前进程的信号掩码集 mask 中删除。因为mask 中存储的是不允许当前进程发生的信号,所以删除在 mask 中的指定信号,就代表允许当前进程接收这个指定的信号,从而实现注册该信号。
这是 8 个过程,我分析的是 glibc 2.21
和 Linux 3.4
版本的源码:
- 调用
sigaction(sig)
注册信号 - 调用底层
glibc
库中的__libc_sigaction(sig)
函数 - 由于上层信号和内核信号有些不同,所以内核将信号转换成内核
kernel_sigaction
,但是基本的成员是差不多的 - 调用系统调用,陷入内核
- 调用内核的
do_sigaction
函数来注册信号 - 因为是注册到当前进程,所以先得到当前进程的结构体 t
- 将要注册的信号 sig 加到当前进程的 mask 中
- 然后将 mask 从当前进程的信号集链表中删除,即删除不允许接收的信号 sig,从而允许接收(注册)信号 sig
处理信号
信号处理的 2 个时刻前面已经介绍了:系统调用返回和中断返回。因为进程本身存储了已经注册的信号的相关信息,包括最终要调用的信号处理函数,所以处理过程就是回调这个信号处理函数,里面的操作逻辑是我们自己定义的操作,这样的函数也被称为「回调函数」。
结语
信号的基本原理和操作就介绍到这里,学习信号必须要理解信号的本质:「信号就是一个软中断」,另外要清楚信号的注册方法,在掌握基本的使用方法后再去了解信号在内核中的实现机制会帮你更好的理解信号,这里因为能力有限不能深入的分析内核的信号机制,希望你在学习的时候能认真实践,也欢迎一起交流。
感谢你的阅读,我们下次再见 :)
本文原创首发于微信公号「登龙」,分享机器学习、算法编程、Python、机器人技术等原创文章,扫码即可关注!
DLonng at 08/06/17