>
Home

登龙(DLonng)

选择大于努力

Linux 高级编程 - 进程控制


版权声明:本文为 DLonng 原创文章,可以随意转载,但必须在明确位置注明出处!

前言

这篇文章主要介绍 Linux 系统中进程控制相关的 API,包括创建,执行,终止等操作。基本的进程相关的概念在上一篇文章中已经介绍过了,不太熟悉的可以再回去了解了解。

进程标识

每个进程都有一个非负整数表示的唯一的进程 ID,因为进程 ID 标识符总是唯一的,所以常常把 ID 作为其他标识符的一部分用来保证唯一性,并且进程的 ID 也是可以复用的,当一个进程终止后,其进程 ID 就可能被其他刚创建的进程所使用。

Linux 系统提供了一些获取进程 ID 的函数:

#include <sys/types.h>
#include <unistd.h>

// 得到当前进程 ID
pid_t getpid(void);

// 得到父进程 ID
pid_t getppid(void);

这两个函数比较简单,就是直接调用然后输出即可,可以自己尝试输出试试。

进程的 system 接口

我们在 Windows 下有 system 接口可以使用,例如打开记事本:

system("notepad");

同样在 Linux 下也有这个接口,可以执行相关的程序:

#include <stdlib.h>

// 调用 fork 函数执行 command 命令
int system(const char *command);

例如,使用 system 接口来执行 ls 命令:

#include <stdio.h>
#include <stdlib.h>

int main() {
	// 调用 ls
	system("ls");
	return 0;
}

system 接口底层其实还是使用系统调用 fork,exec,waitpid 来执行程序,只是在上层又封装了一次。

创建进程 fork

fork 的定义

在 Linux 中,我们使用 fork 来创建一个子进程:

#include <unistd.h>

pid_t fork(void);

fork 的返回值

fork 函数有些特殊,成功它返回 2 次,失败返回 -1,利用这个特性可以判断当前的进程是子进程还是父进程

  1. 在子进程中返回 0
  2. 在父进程中返回子进程的进程 ID
// test_fork1.c

#include <stdio.h>
#include <unistd.h>

int main() {
	pid_t pid = fork();

	if (-1 == pid)
		perror("fork fail");
	else if (0 == pid) // 子进程返回 0
		printf("I'm child process: %d\n", getpid());
	else // 父进程返回子进程 PID
		printf("I'm parent process,fork return is: %d\n", pid);

	return 0;
}

我们编译运行看看效果:

# 编译
gcc test_fork1.c -o test_fork1

# 运行
./test_fork1
I'm parent process,fork return is: 12557
I'm child process: 12557

可以看到父进程的返回值是子进程的 PID:12557,子进程的 PID 正是 12557,这也验证了 fork 的返回值的特点。

fork 的写时复制技术

通过执行 fork,子进程得到父进程的一个副本,例如子进程获得父进程的数据空间,堆和栈的副本,但是它们并不共享存储空间,它们只共享代码段。但是在现在的系统实现中,并不执行拷贝父进程的副本,作为替代方案,而是使用写时复制(Copy - On - Write)技术。

写时复制:在 fork 之后,这些区域由父子进程共享,而且内核将它们的访问权限改变为只读,如果父子进程中的任何一个试图修改这些区域,内核只为修改区域的那片内存制作一个副本给子进程。

不管是哪种技术实现,最后父子进程的数据都是独立的,不会相互影响,我们来看一个实际的例子:

// test_fork2.c

#include <stdio.h>
#include <unistd.h>

int main() {
	int count = 0;

	// 创建子进程
	pid_t pid = fork();

	// 父子进程中都有这个变量
	count++;

	if (-1 == pid)
		perror("fork fail");
	else if (0 == pid) // 子进程 count 变量
		printf("child process count: %d\n", count);
	else // 父进程 count 变量
		printf("parent process count: %d\n", count);

	return 0;
}

编译运行:

# 编译
gcc test_fork2.c -o test_fork2

# 运行
./test_fork2
parent process count: 1
child process count: 1

结果是父子进程中的 count = 1,如果父子进程的 count 不独立的话,子进程的 count 应该等于 2,但是实际上是等于 1,说明父子进程的数据是独立的。

子进程的执行位置

fork 还有一个特点:子进程不是从 main 函数开始执行的,而是从 fork 返回的地方开始,我们来看个实际的例子:

// test_fork3.c

#include <stdio.h>
#include <unistd.h>
#include <sys/types.h>

int main(void) {
	int ret_from_fork = 0;
	int mypid = getpid();

	printf("Before: my pid is %d\n", mypid);

	// 创建子进程,子进程从这里返回
	ret_from_fork = fork();

	sleep(1);

	printf("After: my pid is %d, fork() said %d\n", getpid(), ret_from_fork);
	return 0;
}

编译运行结果:

# 编译
gcc test_fork3.c -o test_fork3

# 运行
./test_fork3
Before: my pid is 9670
After: my pid is 9670, fork() said 9671
After: my pid is 9671, fork() said 0

看到只打印一个 Before 信息,没有打印 2 个 Before 原因是:内核通过复制父进程 9670 来创建子进程 9671,并将父进程 9670 代码和当前运行到的位置都复制到子进程 9671,所以新的子进程 9671 从 fork 返回的地方开始运行,而不是从头开始,也就不会打印开头的 Before 了。

创建进程 vfork

还有一个创建进程的系统调用 vfork,它跟 fork 很相似,但是也有几点不同:

  1. vfork 的目的是创建一个子进程来运行一个程序
  2. vfork 并不复制父进程地址空间,子进程在父进程地址空间中运行,并阻塞父进程直到子进程返回
  3. vfork 保证子进程先运行
  4. 子进程需要调用 exec 或 exit 函数退出,否则会带来未知结果。

来看个实际的例子:

// test_vfork.c

#include <stdio.h>
#include <unistd.h>
#include <stdlib.h>

int main() {
	int count = 0;
	pid_t pid = vfork();
	count++;

	if (-1 == pid) {
		perror("fork fail");
	} else if (0 == pid) {
		printf("child process count : %d\n", count);
		exit(0);
	} else {
		// 父进程会阻塞
		printf("parent process count: %d\n", count);
	}

	return 0;
}

编译运行:

# 编译
gcc test_vfork.c -o test_vfork

# 运行
./test_vfork
child process count: 1
parent process count: 2

这个结果跟前面使用 fork 的例子是不同的,使用 vfork 先打印的子进程信息,再打印父进程的信息,是因为父进程被阻塞了,直到子进程执行完了才有机会执行。并且由于子进程在父进程的地址空间中运行,所以子进程中对 count 加一的操作对父进程也是有效的,因此最后父进程的 count = 2

exec

fork 函数里面最后也是调用 exec 等函数来执行程序的,我们有必须要了解这个函数:

#include <unistd.h>

// path:程序名称,argv:运行参数
int execv(const char *path, char *const argv[]);

exec 有很多变种函数,例如 execlpexecle,等等,但基本的用法都是差不多的,这里就以 execl 为例来看个程序:

#include <stdio.h>
#include <unistd.h>

int main() {
	char* argvs[] = {"ps", "-ef", NULL};
	execv("ps", argvs);
	return 0;
}

运行结果就相当与 shell 命令:ps - ef,其他的变种函数可以通过 man exec 来查看。

进程等待 wait

父进程可以使用 wait 系统调用主动等待子进程或者指定进程结束,并获得子进程的结束信息

#include <sys/types.h>
#include <sys/wait.h>

// 等待子进程结束
pid_t wait(int *wstatus);

// 等待指定的 PID 进程结束
pid_t waitpid(pid_t pid, int *wstatus, int options);

这个系统调用的过程如下:

  1. wait 暂停调用它的进程直到子进程结束
  2. wait 调用成功返回子进程的 PID
  3. wstatus 存储子进程的返回信息(正常退出,异常退出,被信号杀死),以此来知道子进程是如何结束的

大致的流程如下:

F ---fork------> F -------- wait ----> F ------------->
		|                              |
		|                              |
		|                              |
		-------> C -------------exit() -

来看看 wait 是如何使用的:

// test_wait.c

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <sys/wait.h>

int main() {
	int status = 0;
	pid_t pid = fork();
	if (0 == pid) {
		printf("child process\n");
		sleep(3);
		// 父进程会得到 exit 的退出状态码
		exit(0);
	} else if(pid > 0) {
		// 等待子进程返回,wait 运行成功返回子进程 PID
		if (pid == wait(&status))
			printf("child has run ok status = %d, parent processing...\n", status);
	}

	return 0;
}

编译运行:

# 编译
gcc test_wait.c -o test_wait

# 运行
./test_wait
child process
child has run ok status = 0, parent processing...

可以看到父进程成功等待了子进程 3 s,并得到了存储在 status 中的返回值,这个 status 有 2 种状态:

  1. 如果子进程调用 exit 退出,那么内核将 exit 的退出状态码放在 status 中
  2. 如果进程被杀死,内核将信号序列放在 status 中

实际使用时,wait 提供了相关的宏来判断 status 的状态,详情参考 man wait。另外 waitpidwait 几乎的相同的,作为锻炼,就留给你自己去学习吧,参考 man waitpid

进程结束

既然能够创建进程,那肯定能够结束进程,在 Linux 中进程退出又分为正常和异常退出,分别来了解了解。

正常退出

有 5 种正常退出进程的方法:

  1. 在 main 内执行 return,等价于调用 exit
  2. 调用 exit
  3. 调用 _exit_Exit
  4. 进程的最后一个线程在其启动例程中执行 return 语句
  5. 进程的最后一个线程调用 pthread_exit 函数

异常终止

有 3 种异常终止的方法:

  1. 调用 abort,产生 SIGABRT 信号
  2. 当进程接受到某些信号时
  3. 最后一个线程对「取消」请求作出响应

不管是哪种终止情况,我们都可以使用 wait 或者 waitpid 来得到子进程的退出状态。

拓展:在 Linux 内核中查看 fork 执行流程

为了加深对 Linux 进程的理解,下面就来简单了解下 fork 在内核中的具体调用过程。建议你用源码查看工具来跟踪源码,我使用的是 Linux-2.6 的源码,要跟踪的文件是 kernel/fork.c,创建进程的总体过程如下图所示:

fork

总体的流程是创建一个新的任务(task_struct),然后拷贝相关的进程信息,最后唤醒这个进程和后续的准备工作,其中最重要的是 copy_process 这个函数,来看看它的具体执行过程:

copy_process

主要的流程就是先使用 dup_task_struct 复制一个进程结构,然后初始化这个进程信息,再拷贝父进程的相关信息,最后 sched_fork 调度进程。

整个过程大体上就是这样,具体的细节有兴趣可以深入的跟踪,这里就介绍这些了。

结语

本次我们学习了 Linux 中非常重要的进程控制,其中非常重要的是 fork 这个函数,因为我们就是用这个函数来创建进程的,另外我们也在内核中分析了 fork 的具体实现过程,希望通过这篇文章能够让你对 Linux 的进程有一个更加完整的了解和学习,希望你能认真实践。

最后,感谢你的阅读,我们下次再见 :)

本文原创首发于微信公号「登龙」,分享机器学习、算法编程、Python、机器人技术等原创文章,扫码即可关注

DLonng at 08/04/17