2 Linux 多进程开发

mobbu / 2023-07-28 / 原文

2 Linux多进程开发

2.1 进程概述

2.1.1 程序和进程

程序是包含一系列信息的文件，这些信息描述了如何在运行时创建一个进程：

二进制格式标识：每个程序文件都包含用于描述可执行文件格式的元信息。内核利用此信息来解释文件中的其他信息。（ELF可执行连接格式）
机器语言指令：对程序算法进行编码。
程序入口地址：标识程序开始执行时的起始指令位置。
数据：程序文件包含的变量初始值和程序使用的字面量值（比如字符串）。
符号表及重定位表：描述程序中函数和变量的位置及名称。这些表格有多重用途，其中包括调试和运行时的符号解析（动态链接）。
共享库和动态链接信息：程序文件所包含的一些字段，列出了程序运行时需要使用的共享库，以及加载共享库的动态连接器的路径名。
其他信息：程序文件还包含许多其他信息，用以描述如何创建进程。
进程是正在运行的程序的实例。是一个具有一定独立功能的程序关于某个数据集合的一次运行活动。它是操作系统动态执行的基本单元，在传统的操作系统中，进程既是基本的分配单元，也是基本的执行单元。
可以用一个程序来创建多个进程，进程是由内核定义的抽象实体，并为该实体分配用以执行程序的各项系统资源。从内核的角度看，进程由用户内存空间和一系列内核数据结构组成，其中用户内存空间包含了程序代码及代码所使用的变量，而内核数据结构则用于维护进程状态信息。记录在内核数据结构中的信息包括许多与进程相关的标识号（IDs）、虚拟内存表、打开文件的描述符表、信号传递及处理的有关信息、进程资源使用及限制、当前工作目录和大量的其他信息。

2.1.2 单道、多道程序设计

单道程序，即在计算机内存中只允许一个的程序运行。
多道程序设计技术是在计算机内存中同时存放几道相互独立的程序，使它们在管理程序控制下，相互穿插运行，两个或两个以上程序在计算机系统中同处于开始到结束之间的状态, 这些程序共享计算机系统资源。引入多道程序设计技术的根本目的是为了提高 CPU 的利用率。
对于一个单 CPU 系统来说，程序同时处于运行状态只是一种宏观上的概念，他们虽然都已经开始运行，但就微观而言，任意时刻，CPU 上运行的程序只有一个。
在多道程序设计模型中，多个进程轮流使用 CPU。而当下常见 CPU 为纳秒级，1秒可以执行大约 10 亿条指令。由于人眼的反应速度是毫秒级，所以看似同时在运行。

2.1.3 时间片

时间片（timeslice）又称为“量子（quantum）”或“处理器片（processor slice）”是操作系统分配给每个正在运行的进程微观上的一段 CPU 时间。事实上，虽然一台计算机通常可能有多个 CPU，但是同一个 CPU 永远不可能真正地同时运行多个任务。在只考虑一个 CPU 的情况下，这些进程“看起来像”同时运行的，实则是轮番穿插地运行，

由于时间片通常很短（在 Linux 上为 5ms－800ms），用户不会感觉到。

时间片由操作系统内核的调度程序分配给每个进程。首先，内核会给每个进程分配相等的初始时间片，然后每个进程轮番地执行相应的时间，当所有进程都处于时间片耗尽的状态时，内核会重新为每个进程计算并分配时间片，如此往复。

2.1.4 并行和并发

并行(parallel)：指在同一时刻，有多条指令在多个处理器上同时执行。
并发(concurrency)：指在同一时刻只能有一条指令执行，但多个进程指令被快速的轮换执行，使得在宏观上具有多个进程同时执行的效果，但在微观上并不是同时执行的，只是把时间分成若干段，使多个进程快速交替的执行。

并发是两个队列交替使用一台咖啡机。
并行是两个队列同时使用两台咖啡机。

2.1.5 进程控制块（PCB）

为了管理进程，内核必须对每个进程所做的事情进行清楚的描述。内核为每个进程分配一个 PCB(Processing Control Block)进程控制块，维护进程相关的信息，Linux 内核的进程控制块是 task_struct 结构体。
在 /usr/src/linux-headers-xxx/include/linux/sched.h 文件中可以查看 struct task_struct 结构体定义。其内部成员有很多，我们只需要掌握以下部分即可：
- 进程id：系统中每个进程有唯一的 id，用 pid_t 类型表示，其实就是一个非负整数
- 进程的状态：有就绪、运行、挂起、停止等状态
- 进程切换时需要保存和恢复的一些CPU寄存器
- 描述虚拟地址空间的信息
- 描述控制终端的信息
- 当前工作目录（Current Working Directory）
- umask 掩码
- 文件描述符表，包含很多指向 file 结构体的指针
- 和信号相关的信息
- 用户 id 和组 id
- 会话（Session）和进程组
- 进程可以使用的资源上限（Resource Limit）

2.2 进程状态转换

2.2.1 进程的状态

进程状态反映进程执行过程的变化。这些状态随着进程的执行和外界条件的变化而转换。在三态模型中，进程状态分为三个基本状态，即就绪态，运行态，阻塞态。在五态模型中，进程分为新建态、就绪态，运行态，阻塞态，终止态。

运行态：进程占有处理器正在运行
就绪态：进程具备运行条件，等待系统分配处理器以便运行。当进程已分配到除CPU以外的所有必要资源后，只要再获得CPU，便可立即执行。在一个系统中处于就绪状态的进程可能有多个，通常将它们排成一个队列，称为就绪队列
阻塞态：又称为等待(wait)态或睡眠(sleep)态，指进程不具备运行条件，正在等待某个事件的完成

新建态：进程刚被创建时的状态，尚未进入就绪队列
终止态：进程完成任务到达正常结束点，或出现无法克服的错误而异常终止，或被操作系统及有终止权的进程所终止时所处的状态。进入终止态的进程以后不再执行，但依然保留在操作系统中等待善后。一旦其他进程完成了对终止态进程的信息抽取之后，操作系统将删除该进程。

2.2.2 进程相关命令

查看进程
- ps aux / ajx
- a：显示终端上的所有进程，包括其他用户的进程
- u：显示进程的详细信息
- x：显示没有控制终端的进程
- j：列出与作业控制相关的信息
STAT参数意义：
- D 不可中断 Uninterruptible（usually IO）
- R 正在运行，或在队列中的进程
- S(大写) 处于休眠状态
- T 停止或被追踪
- Z 僵尸进程
- W 进入内存交换（从内核2.6开始无效）
- X 死掉的进程
- < 高优先级
- N 低优先级
- s 包含子进程
- + 位于前台的进程组
实时显示进程动态 : top
可以在使用 top 命令时加上 -d 来指定显示信息更新的时间间隔，在 top 命令执行后，可以按以下按键对显示的结果进行排序：
- M 根据内存使用量排序
- P 根据 CPU 占有率排序
- T 根据进程运行时间长短排序
- U 根据用户名来筛选进程
- K 输入指定的 PID 杀死进程
杀死进程
- kill [-signal] pid
- kill –l 列出所有信号
- kill –SIGKILL 进程ID
- kill -9 进程ID,强制关闭进程
- killall name 根据进程名杀死进程

2.2.3 进程号和相关函数

每个进程都由进程号来标识，其类型为 pid_t（整型），进程号的范围：0～32767。进程号总是唯一的，但可以重用。当一个进程终止后，其进程号就可以再次使用。
任何进程（除 init 进程）都是由另一个进程创建，该进程称为被创建进程的父进程，对应的进程号称为父进程号（PPID）。
进程组是一个或多个进程的集合。他们之间相互关联，进程组可以接收同一终端的各种信号，关联的进程有一个进程组号（PGID）。默认情况下，当前的进程号会当做当前的进程组号。
进程号和进程组相关函数：
- pid_t getpid(void);
- pid_t getppid(void);
- pid_t getpgid(pid_t pid);

2.3 进程创建

2.3.1 进程创建

系统允许一个进程创建新进程，新进程即为子进程，子进程还可以创建新的子进程，形成进程树结构模型。

pid_t fork(void);
- 作用:用于创建子进程。
- 返回值:
  fork()的返回值会返回两次。一次是在父进程中，一次是在子进程中
  在父进程中返回创建的子进程的ID
  在子进程中返回0
  如何区分父进程和子进程:通过fork的返回值
  在父进程中返回-1，表示创建子进程失败，并且设置errno
- 失败的两个主要原因：
  1. 当前系统的进程数已经达到了系统规定的上限，这时 errno 的值被设置
    为 EAGAIN
  2. 系统内存不足，这时 errno 的值被设置为 ENOMEM
示例代码：

#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>

int main(){
    
    //创建子进程
    pid_t pid = fork();

    // 判断是父进程还是子进程
    if(pid > 0){
        printf("pid : %d\n",pid);
        // 如果大于0，返回的是创建的子进程的进程号，当前是父进程
        printf("I am parent process, pid : %d, ppid : %d\n", getpid(),getppid());
    }else if(pid == 0){
        // 当前是子进程
        printf("I am child process, pid : %d, ppid : %d\n", getpid(), ppid());
    }

    // for 循环
    for(int i = 0; i < 3; i++){
        printf("i : %d\n", i);
        sleep(1);
    }

    return 0;
}

2.3.2 父子进程虚拟地址空间情况

fork()以后，子进程的用户区数据和父进程一样。内核区也会拷贝过来，但是pid不同
实际上，更准确来说，Linux的 fork()使用是通过写时拷贝(copy- on-write)实现。

写时拷贝是一种可以推迟甚至避免拷贝数据的技术。内核此时并不复制整个进程的地址空间，而是让父子进程共享同一个地址空间。只用在需要写入的时候才会复制地址空间，从而使各个进行拥有各自的地址空间。也就是说，资源的复制是在需要写入的时候才会进行，在此之前，只有以只读方式共享。

注意: fork之后父子进程共享文件，fork产生的子进程与父进程相同的文件文件描述符指向相同的文件表，引用计数增加，共享文件偏移指计。

2.3.3 父子进程关系及GDB多进程调试

父子进程之间的关系
- 区别
  1. fork()函数的返回值不同
    - 父进程中:>0返回的子进程的ID
    - 子进程中:=O
  2. pcb中的一些数据
    - 当前的进程的id pid
    - 当前的进程的父进程的id ppid信号集
    - 信号集
- 相同点：
  某些状态下：子进程刚被创建出来，还没有执行任何的写数据的操作
  - 用户区的数据
  - 文件描述符表
- 父子进程对变量是不是共享的?
  - 刚开始的时候，是一样的，共享的。如果修改了数据，不共享了。
  - 读时共享（子进程被创建，两个进程没有做任何的写的操作），写时拷贝。
使用 GDB 调试的时候，GDB 默认只能跟踪一个进程，可以在 fork 函数调用之前，通过指令设置 GDB 调试工具跟踪父进程或者是跟踪子进程，默认跟踪父进程。
设置调试父进程或者子进程：set follow-fork-mode [parent（默认）| child]
设置调试模式：set detach-on-fork [on | off]
默认为 on，表示调试当前进程的时候，其它的进程继续运行，如果为 off，调试当前进程的时候，其它进程被 GDB 挂起。
查看调试的进程：info inferiors
切换当前调试的进程：inferior id（此时的id为nfo inferiors查询到的num值并非pid）
使进程脱离 GDB 调试：detach inferiors id

2.4 exec 函数族

2.4.1 exec 函数族介绍

exec 函数族的作用是根据指定的文件名找到可执行文件，并用它来取代调用进程的内容，换句话说，就是在调用进程内部执行一个可执行文件。
exec 函数族的函数执行成功后不会返回，因为调用进程的实体，包括代码段，数据段和堆栈等都已经被新的内容取代，只留下进程 ID 等一些表面上的信息仍保持原样，颇有些神似“三十六计”中的“金蝉脱壳”。看上去还是旧的躯壳，却已经注入了新的灵魂。只有调用失败了，它们才会返回 -1，从原程序的调用点接着往下执行。

2.4.2 exec 函数族

int execl(const char *path, const char *arg, ...);
- 参数:
  - path:需要指定的执行的文件的路径或者名称
    - a.out /home/nowcoder/a.out 推荐使用绝对路径
    - ./a.out hello world
  - arg:是执行可执行文件所需要的参数列表
    - 第一个参数一般没有什么作用，为了方便，一般写的是执行的程序的名字
    - 从第二个参数开始往后，就是程序执行所需要的的参数列表。
    - 参数最后需要以NULL结束（哨兵）
- 返回值:
  只有当调用失败,才会有返回值,返回-1，并且设置errno
  如果调用成功，没有返回值。
- 代码：
```
execl("app","app",NULL);
```
int execlp(const char *file, const char *arg, ... );
- 会到当前的环境变量中去查找可执行文件，如果找到了就执行，找不到就执行不成功
- 参数:
  - path:需要指定的执行的文件的文件名
    - a.out
    - ps
  - arg:是执行可执行文件所需要的参数列表
    - 第一个参数一般没有什么作用，为了方便，一般写的是执行的程序的名字
    - 从第二个参数开始往后，就是程序执行所需要的的参数列表。
    - 参数最后需要以NULL结束（哨兵）
- 返回值:
  只有当调用失败,才会有返回值,返回-1，并且设置errno
  如果调用成功，没有返回值。
- 代码：
```
execlp("ps","ps","aux",NULL)
```
int execle(const char *path, const char *arg, .../*, (char *) NULL, char * const envp[] */);
int execv(const char *path, char *const argv[]);
- argv是需要的参数的一个字符串数组
- 代码：
```
char *argv[] = {"/bin/ps","aux",NULL}；
execv("ps", argv)；
```
int execvp(const char *file, char *const argv[]);
int execvpe(const char *file, char *const argv[], char *const envp[]);
int execve(const char *filename, char *const argv[], char *const envp[]);
- filename：文件名
- argv: 参数列表
- envp：环境变量


l(list)	参数地址列表，以空指针结尾
v(vector)	存有各参数地址的指针数组的地址
p(path) 按 PATH	环境变量指定的目录搜索可执行文件
e(environment)	存有环境变量字符串地址的指针数组的地址

2.5 进程退出、孤儿进程、僵尸进程

2.5.1 进程退出

两种方式退出进程

#include <stdlib.h>
void exit(int status);

#include <unistd.h>
void _exit(int status);

两者之间的区别：exit()多执行了红框之内的工作

2.5.2 孤儿进程

父进程运行结束，但子进程还在运行（未运行结束），这样的子进程就称为孤儿进程（Orphan Process）。
每当出现一个孤儿进程的时候，内核就把孤儿进程的父进程设置为 init ，而 init 进程会循环地 wait() 它的已经退出的子进程。这样，当一个孤儿进程凄凉地结束了其生命周期的时候，init 进程就会代表党和政府出面处理它的一切善后工作。
因此孤儿进程并不会有什么危害。

2.5.3 僵尸进程

每个进程结束之后, 都会释放自己地址空间中的用户区数据，内核区的 PCB 没有办法自己释放掉，需要父进程去释放。
进程终止时，父进程尚未回收，子进程残留资源（PCB）存放于内核中，变成僵尸（Zombie）进程。
僵尸进程不能被 kill -9 杀死，这样就会导致一个问题，如果父进程不调用 wait() 或 waitpid() 的话，那么保留的那段信息就不会释放，其进程号就会一直被占用，但是系统所能使用的进程号是有限的，如果大量的产生僵尸进程，将因为没有可用的进程号而导致系统不能产生新的进程，此即为僵尸进程的危害，应当避免。

2.5.4 进程回收

在每个进程退出的时候，内核释放该进程所有的资源、包括打开的文件、占用的内存等。但是仍然为其保留一定的信息，这些信息主要主要指进程控制块PCB的信息（包括进程号、退出状态、运行时间等）。
父进程可以通过调用wait或waitpid得到它的退出状态同时彻底清除掉这个进程。
pid_t wait(int *wstatus);
- 功能：创建一个匿名管道，用来进程间通信。
- 参数：
  - int pipefd[2] 这个数组是一个传出参数。
  - pipefd[0] 对应的是管道的读端
  - pipefd[1] 对应的是管道的写端
- 返回值：
  - 成功 0
  - 失败 -1
pid_t waitpid(pid_t pid, int *wstatus, int options);
- 功能：回收指定进程号的子进程，可以设置是否阻塞。
- 参数：
  - pid:
    - pid > 0 : 某个子进程的pid
    - pid = 0 : 回收当前进程组的所有子进程
    - pid = -1 : 回收所有的子进程，相当于 wait() （最常用）
    - pid < -1 : 某个进程组的组id的绝对值，回收指定进程组中的子进程
  - options：设置阻塞或者非阻塞
    - 0 : 阻塞
    - WNOHANG : 非阻塞
  - 返回值：
    - 0 : 返回子进程的id
    - = 0 : options=WNOHANG, 表示还有子进程或者
    - = -1 ：错误，或者没有子进程了
wait() 和 waitpid() 函数的功能一样，区别在于，wait() 函数会阻塞，waitpid() 可以设置不阻塞，waitpid() 还可以指定等待哪个子进程结束。
注意：一次wait或waitpid调用只能清理一个子进程，清理多个子进程应使用循环。

04 / 退出信息相关宏函数
◼ WIFEXITED(status) 非0，进程正常退出
◼ WEXITSTATUS(status) 如果上宏为真，获取进程退出的状态（exit的参数）
◼ WIFSIGNALED(status) 非0，进程异常终止
◼ WTERMSIG(status) 如果上宏为真，获取使进程终止的信号编号
◼ WIFSTOPPED(status) 非0，进程处于暂停状态
◼ WSTOPSIG(status) 如果上宏为真，获取使进程暂停的信号的编号
◼ WIFCONTINUED(status) 非0，进程暂停后已经继续运行

2.5 进程间通信简介 IPC

2.5.1 进程间通信概念

进程是一个独立的资源分配单元，不同进程(这里所说的进程通常指的是用户进程)之间的资源是独立的，没有关联，不能在一个进程中直接访问另一个进程的资源。
但是，进程不是孤立的，不同的进程需要进行信息的交互和状态的传递等，因此需要进程:间通信(IPC: Inter Processes Communication )。
进程间通信的目的:
- 数据传输:一个进程需要将它的数据发送给另一个进程。
- 通知事件:一个进程需要向另一个或一组进程发送消息，通知它(它们)发生了某种事件(如进程终止时要通知父进程)。
- 资源共享: 多个进程之间共享同样的资源。为了做到这一点，需要内核提供互斥和同步机制。
- 进程控制:有些进程希望完全控制另一个进程的执行(如Debug进程)，此时控制进程希望能够拦截另一个进程的所有陷入和异常，并能够及时知道它的状态改变。

2.5.2 进程间通信不同类型

2.5.3 匿名管道概述

管道也叫无名(匿名)管道，他们是UNIX系统IPC的最古老的形式，所有的UNIX系统都支持这种通信机制
统计一个目录中文件的数目命令：ls | wc -l，为了执行该命令，shell创建了两个进程来分别执行ls和wc

2.5.4 管道的特点

管道其实是一个在内核内存中维护的缓冲器，这个缓冲器的存储能力是有限的，不同的操作系统大小不一定相同。
管道拥有文件的特质:读操作、写操作，匿名管道没有文件实体，有名管道有文件实体,但不存储数据。可以按照操作文件的方式对管道进行操作。
一个管道是一个字节流，使用管道时不存在消息或者消息边界的概念，从管道读取数据的进程可以读取任意大小的数据块，而不管写入进程写入管道的数据块的大小是多少。
通过管道传递的数据是顺序的，从管道中读取出来的字节的顺序和它们被写入管道的顺序是完全一样的。
在管道中的数据的传递方向是单向的，一端用于写入，一端用于读取，管道是半双工的
从管道读数据是一次性操作，数据一旦被读走，它就从管道中被拋弃，释放空间以便写更多的数据，在管道中无法使用lseek() 来随机的访问数据。
匿名管道只能在具有公共祖先的进程(父进程与子进程，或者两个兄弟进程，具有亲缘关系)之间使用。

2.5.5 为什么可以使用管道进行进程间通信

2.5.6 管道的数据结构

循环队列（环形队列）

2.5.7 匿名管道的使用

`#include <unistd.h>
int pipe(int pipefd[2]);
- 功能：创建一个匿名管道，用来进程间通信。
- 参数：int pipefd[2] 这个数组是一个传出参数。
  - pipefd[0] 对应的是管道的读端
  - pipefd[1] 对应的是管道的写端
- 返回值：
  - 成功 0
  - 失败 -1
- 管道默认是阻塞的：如果管道中没有数据，read阻塞，如果管道满了，write阻塞
- 注意：匿名管道只能用于具有关系的进程之间的通信（父子进程，兄弟进程）

// 获取管道的大小
long size = fpathconf(pipefd[0], _PC_PIPE_BUF);

一般不会同时读和写，比如子进程一般不会同时读取父进程的数据和写如数据，否则会出现读取信息流错误的情况，比如子进程读到自己写的数据。

2.5.8 管道案例

/*
    实现 ps aux | grep xxx 父子进程间通信
    子进程： ps aux, 子进程结束后，将数据发送给父进程
    父进程：获取到数据，过滤
    pipe()
    execlp()
    子进程将标准输出 stdout_fileno 重定向到管道的写端。  dup2
*/
#include <unistd.h>
#include <sys/types.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <wait.h>
int main() {
    // 创建一个管道
    int fd[2];
    int ret = pipe(fd);
    if(ret == -1) {
        perror("pipe");
        exit(0);
    }
    // 创建子进程
    pid_t pid = fork();
    if(pid > 0) {// 父进程
    // 关闭写端
        close(fd[1]);
        // 从管道中读取
        char buf[1024] = {0};
        int len = -1;
        while((len = read(fd[0], buf, sizeof(buf) - 1)) > 0) {
            // 过滤数据输出
            printf("%s", buf);
            memset(buf, 0, 1024);
        }
        wait(NULL);
    } else if(pid == 0) {
        // 子进程
        // 关闭读端
        close(fd[0]);
        // 文件描述符的重定向 stdout_fileno -> fd[1]
        dup2(fd[1], STDOUT_FILENO);
        // 执行 ps aux
        execlp("ps", "ps", "aux", NULL);
        perror("execlp");
        exit(0);
    } else {
        perror("fork");
        exit(0);
    }
    return 0;
}

2.5.9 管道的读写特点和管道设置为非阻塞

读管道：
- 管道中有数据，read返回实际读到的字节数。
- 管道中无数据：
  - 写端被全部关闭，read返回0（相当于读到文件的末尾）
  - 写端没有完全关闭，read阻塞等待
写管道：
- 管道读端全部被关闭，进程异常终止（进程收到SIGPIPE信号）
- 管道读端没有全部关闭：
  - 管道已满，write阻塞
  - 管道没有满，write将数据写入，并返回实际写入的字节数