首页 > 当执行fork()函数的时候,到底发生了什么

当执行fork()函数的时候,到底发生了什么

fork函数是unix系统中实现多进程的一个基本函数,它看起来非常特殊。首先它创建了一个或多个自身进程的自进程,并且继承了当前进程的上下文资源。

这一个过程具体是怎么完成的?它是如何做到多个进程同时监听一个资源的,比如有一个tcp连接进来,那么到底应该是哪个子进程去响应这个请求呢?如果子进程再次fork自己会发生什么,可以不停这样下去吗?


先说一下fork,fork会生成一个和当前进程相同的副本,称为子进程。原进程的所有资源都以适当的方式复制到子进程,因此该系统调用之后,原来的进程就有了两个独立的实例。这两个实例的联系包括:同一组打开文件、同样的工作目录、内存中同样的数据(两个进程各有一份副本)。当然Linux使用了copy on write,也就是说只有新的进程对内存页执行write操作的时候才会复制内存页面。

具体如何完成:
首先要了解一下task_struct这个数据结构。Linux内核很多涉及进程的部分都围绕这个数据结构(数据结构定义在include/sched.h中,有兴趣去看一下)。数据结构里面的成员非常多,下面会按照几个部分介绍一下。

  1. 状态和执行信息,如待决信号、使用的二进制格式(和其他系统二进制格式的任何仿真信息)、进程ID号(pid)、到父进程及其他有关进程的指针、优先级和程序执行有关的时间信息(例如CPU时间)。
  2. 有关已经分配的虚拟内存的信息。
  3. 进程身份凭据,如用户ID、组ID以及权限等。可使用系统调用查询(或修改)这些数据。
  4. 使用的文件包含程序代码的二进制文件,以及进程所处理的所有文件的文件系统信息,这些都必须保存下来。
  5. 线程信息记录该进程特定于CPU的运行时间数据(该结构的其余字段与所使用的硬件无关)。
  6. 在与其他应用程序协作时所需的进程间通信有关的信息。
  7. 该进程所用的信号处理程序,用于响应到来的信号。

fork之后,操作系统会copy当前进程的task_struct机构体,除了id号不一样之外,其余完全一样。fork之后如果没有调用exec(),那么仅仅只是生成多个当前的进程,提升并发的能力,比如说nginx。nginx的进程都是master进程fork出来的,所以他们有相同的监听句柄。至于是哪个worker进程去响应,nginx有自己的竞争方式。

最后关于子进程fork自己会发生什么。请看下图:

linux启动时候只有一个init进程,剩下的题主自行理解。


fork并不算是基本函数,它调用的clone,而clone函数有参数可以进行更灵活的配置。

【热门文章】
【热门文章】