fork是系统调用,使用系统调用fork编写一个c程序

第三方分享代码
hacker 3年前 (2022-09-12) 教育 176 4

介绍:

linux下的fork()函数属于内核函数还是C库函数?

如楼上所述,fork()是一个系统调用。

所有的线程或者进程处理函数都是系统调用,因为每种系统系统对进程或者线程的实现方式都不一定相同,C库函数不可能做到预测到每种系统的实现方式。

什么是fork,它是干什么的,有什么作用?

在Linux下产生新的进程的系统调用就是fork函数,这个函数名是英文中“分叉”的意思。为什么取这个名字呢?因为一个进程在运行中,如果使用了fork,就产生了另一个进程,于是进程就“分叉”了,所以这个名字取得很形象。下面就看看如何具体使用fork,这段程序演示了使用fork的基本框架: void main(){ int I; if ( fork() == 0 ) { /* 子进程程序 */ for ( I = 1; I 1000; I ++ ) printf("This is child process\n"); } else { /* 父进程程序*/ for ( I = 1; I 1000; I ++ ) printf("This is process process\n"); } } 程序运行后,你就能看到屏幕上交替出现子进程与父进程各打印出的一千条信息了。如果程序还在运行中,你用ps命令就能看到系统中有两个它在运行了。 那么调用这个fork函数时发生了什么呢?一个程序一调用fork函数,系统就为一个新的进程准备了前述三个段,首先,系统让新的进程与旧的进程使用同一个代码段,因为它们的程序还是相同的,对于数据段和堆栈段,系统则复制一份给新的进程,这样,父进程的所有数据都可以留给子进程,但是,子进程一旦开始运行,虽然它继承了父进程的一切数据,但实际上数据却已经分开,相互之间不再有影响了,也就是说,它们之间不再共享任何数据了。而如果两个进程要共享什么数据的话,就要使用另一套函数(shmget,shmat,shmdt等)来操作。现在,已经是两个进程了,对于父进程,fork函数返回了子程序的进程号,而对于子程序,fork函数则返回零,这样,对于程序,只要判断fork函数的返回值,就知道自己是处于父进程还是子进程中。 读者也许会问,如果一个大程序在运行中,它的数据段和堆栈都很大,一次fork就要复制一次,那么fork的系统开销不是很大吗?其实UNIX自有其解决的办法,大家知道,一般CPU都是以“页”为单位分配空间的,象INTEL的CPU,其一页在通常情况下是4K字节大小,而无论是数据段还是堆栈段都是由许多“页”构成的,fork函数复制这两个段,只是“逻辑”上的,并非“物理”上的,也就是说,实际执行fork时,物理空间上两个进程的数据段和堆栈段都还是共享着的,当有一个进程写了某个数据时,这时两个进程之间的数据才有了区别,系统就将有区别的“页”从物理上也分开。系统在空间上的开销就可以达到最小。

fork和exec系统调用的区别

shell的命令可以分为内部命令和外部命令. 内部命令是由特殊的文件格式.def实现的,如cd,ls等.而外部命令是通过系统调用或独立程序实现的,如awk,sed. source和exec都是内部命令.

fork

使用 fork 方式运行 script 时, 就是让 shell(parent process) 产生一个 child process 去执行该 script, 当 child process 结束后, 会返回 parent process,但 parent process 的环境是不会因 child process 的改变而改变的.

source

使用 source 方式运行 script 时, 就是让 script 在当前 process 内执行, 而不是产生一个 child process 来执行. 由于所有执行结果均于当前 process 内完成,若 script 的环境有所改变, 当然也会改变当前 process 环境了.

source ./my.sh 或 . ./my.sh

exec

使用 exec 方式运行script时, 它和 source 一样, 也是让 script 在当前process内执行, 但是 process 内的原代码剩下部分将被终止. 同样, process 内的环境随script 改变而改变.

结论:通常如果我们执行时,都是默认为fork的。大家可以通过pstree命令看看关于父子进程的关系。如上,如果想让父进程得到子进程的环境变量,就是source方式了

fork ( /directory/script.sh)

fork是最普通的, 就是直接在脚本里面用/directory/script.sh来调用script.sh这个脚本.运行的时候开一个sub-shell执行调用的脚本,sub-shell执行的时候, parent-shell还在。sub-shell执行完毕后返回parent-shell. sub-shell从parent-shell继承环境变量.但是sub-shell中的环境变量不会带回parent-shell

source (source /directory/script.sh)

与fork的区别是不新开一个sub-shell来执行被调用的脚本,而是在同一个shell中执行. 所以被调用的脚本中声明的变量和环境变量, 都可以在主脚本中得到和使用.

exec (exec /directory/script.sh)

exec与fork不同,不需要新开一个sub-shell来执行被调用的脚本. 被调用的脚本与父脚本在同一个shell内执行。但是使用exec调用一个新脚本以后, 父脚本中exec行之后的内容就不会再执行了。这是exec和source的区别

1.sh

代码:

#!/bin/bash

A=B

echo "PID for 1.sh before exec/source/fork: $$"

export A

echo "1.sh: \$A is $A"

case $1 in

exec)

echo "using exec..."

exec ./2.sh ;;

source)

echo "using source..."

. ./2.sh ;;

*)

echo "using fork by default..."

./2.sh ;;

esac

echo "PID for 1.sh after exec/source/fork: $$"

echo "1.sh: \$A is $A"

2.sh

代码:

#!/bin/bash

echo "PID for 2.sh: $$"

echo "2.sh get \$A=$A from 1.sh"

A=C

export A

echo "2.sh: \$A is $A"

然后,分别跑如下参数来观察结果:

$ ./1.sh fork

$ ./1.sh source

$ ./1.sh exec

fork系统调用的执行过程是怎样

(代码验证) fork确实创建了一个子进程并完全复制父进程,但是子进程是从fork后面那个指令开始执行的。

对于原因也很合逻辑,如果子进程也从main开头到尾执行所有指令,那它执行到fork指令时也必定会创建一个子子进程,如此下去这个小小的程序就可以创建无数多个进程可以把你的电脑搞瘫痪,所以fork作者肯定不会傻到这种程度fork和线程,进程的理解2011-10-11 10:09 本文分为三部分:1. 什么是fork?2. fork用途?3. fork怎么工作? 1. 什么是fork?Fork源于OS中多线程任务的需要。在传统的Unix环境下,有两个基本的操作用于创建和修改进程:函数fork( )用来创建一个新的进程,该进程几乎是当前进程的一个完全拷贝;函数族exec( )用来启动另外的进程以取代当前运行的进程。下面说一下进程和线程。进程的简单理解就是:一个进程表示的就是一个可执行程序的一次执行过程中的一个状态。一个进程,主要包含三个元素:一个可以执行的程序; --- 代码段

和该进程相关联的全部数据(包括变量,内存空间,缓冲区等等); --- 数据段

程序的执行上下文(execution context)。 --- 堆栈段 "代码段",顾名思义,就是存放了程序代码的数据,假如机器中有数个进程运行相同的一个程序,那么它们就可以使用相同的代码段。"堆栈段"存放的就是子程序的返回地址、子程序的参数以及程序的局部变量。而数据段则存放程序的全局变量,常数以及动态数据分配的数据空间(比如用malloc之类的函数取得的空间)。 一般的CPU都有上述三种段寄存器,以方便操作系统的运行。这三个部分也是构成一个完整的执行序列的必要的部分。系统如果同时运行数个相同的程序,它们之间就不能使用同一个堆栈段和数据段。 操作系统对进程管理,最典型的是通过进程表完成的。进程表里再通过一个称为“程序计数器(program counter, pc)”的寄存器来完成“上下文的切换”。(实际的上下文交换需要涉及到更多的数据,和fork无关,不再多说,PC主要用于指出程序当前已经执行到哪里,是进程上下文的重要内容,换出CPU的进程要保存这个寄存器的值,换入CPU的进程,也要根据进程表中保存的本进程执行上下文信息,更新这个寄存器)。 进程表中的每一个表项,记录的是当前操作系统中一个进程的情况。对于单 CPU的情况而言,每一特定时刻只有一个进程占用 CPU,但是系统中可能同时存在多个活动的(等待执行或继续执行的)进程。

PC用于指出当前占用 CPU的进程要执行的下一条指令的位置。 当分给某个进程的 CPU时间已经用完,操作系统将该进程相关的寄存器的值,保存到该进程在进程表中对应的表项里面;把将要接替这个进程占用 CPU的那个进程的上下文,从进程表中读出,并更新相应的寄存器(这个过程称为“上下文交换(process context switch)” 下面继续说fork了。当程序执行到下面的语句:pid=fork(); 操作系统创建一个新的进程(子进程),并且在进程表中相应为它建立一个新的表项。新进程和原有进程的可执行程序是同一个程序;上下文和数据,绝大部分就是原进程(父进程)的拷贝,但它们是两个相互独立的进程!此时程序寄存器pc,在父、子进程的上下文中都声称,这个进程目前执行到fork调用即将返回(此时子进程不占有CPU,子进程的pc不是真正保存在寄存器中,而是作为进程上下文保存在进程表中的对应表项内)。问题是怎么返回。它们的返回顺序是不确定的,取决于OS内的调度。如果想明确它们的执行顺序,就得实现“同步”,或者是使用vfork()。这里假设父进程继续执行,操作系统对fork的实现,使这个调用在父进程中返回刚刚创建的子进程的pid(一个正整数),所以下面的if语句中pid0, pid==0的两个分支都不会执行。所以一般执行fork后都会有两个输出。 2. Fork用途归结起来有两个:第一, 一个进程希望复制自身,从而父子进程能执行不同代码段。第二, 进程想执行另外一个程序归结起来说就是实现多线程。C语言多线程实现需要自己控制来实现,这个比JAVA要复杂。 3. Fork怎么工作?先看一个例子:#include unistd.h;#include sys/types.h;int main (){ pid_t pid; pid=fork(); // 1)从这里开始程序分岔,父子进程都从这一句开始执行一次 if (pid 0) printf("error!"); else if (pid == 0) printf("child process, process id is %dn", getpid()); else // pid 0 printf("parent process, process id is %dn",getpid());

return 0;}结果:[root@localhost yezi]# ./a.out

parent process, process id is 4285 对于上面程序段有以下几个关键点: (1)返回值的问题:正确返回:父进程中返回子进程的pid,因此 0;子进程返回0

错误返回:-1 子进程是父进程的一个拷贝。即,子进程从父进程得到了数据段和堆栈段的拷贝,这些需要分配新的内存;而对于只读的代码段,通常使用共享内存的方式访问。父进程与子进程的不同之处在于:fork的返回值不同——父进程中的返回值为子进程的进程号,而子进程为0。只有父进程执行的getpid()才是他自己的进程号。对子进程来说,fork返回给它0,但它的pid绝对不会是0;之所以fork返回0给它,是因为它随时可以调用getpid()来获取自己的pid; (2) fork返回后,子进程和父进程都从调用fork函数的下一条语句开始执行。这也是程序中会打印两个结果的原因。 fork之后,操作系统会复制一个与父进程完全相同的子进程。不过这在操作系统看来,他们更像兄弟关系,这2个进程共享代码空间,但是数据空间是互相独立的,子进程数据空间中的内容是父进程的完整拷贝,指令指针也完全相同,但只有一点不同,如果fork成功,子进程中fork的返回值是0,父进程中fork的返回值是子进程的进程号,如果fork不成功,父进程会返回错误。2个进程一直同时运行,而且步调一致,在fork之后,他们分别作不同的工作,也就是分岔了。这也是fork为什么叫fork的原因。至于哪一个先运行,与操作系统的调度算法有关,而且这个问题在实际应用中并不重要,如果需要父子进程协同,可以通过原语的办法实现同步来加以解决。 为了加深理解,看下面例子:#include stdio.h

#include "../include/apue.h"

#include unistd.hint main(){pid_t a_pid, b_pid;

if((a_pid=fork())0) // // 一定要有红色括号!! 没有的话就a_pid永远等于0,则永远不会执行父进程!!!

printf("error!");

else if(a_pid==0){printf("the first child's pid=%d\n",getpid());

printf("b\n");}else{printf("the parent's pid=%d\n",getpid());

printf("a\n");

} if((b_pid=fork())0)

printf("error!");

else if(b_pid==0){printf("c\n");}else{printf("e\n");}return 0;} 输出的结果: (1)the first child's pid=12623bcethe parent's pid=12622ace (2)the first child's pid=12638bthe parent's pid=12637acece (3)the first child's pid=12642bthe parent's pid=12641accee 很奇妙的结果。不过理解了“子进程和父进程都从调用fork函数的下一条语句开始执行”了也不奇怪了。同是这里引入理解fork的第三点 (3) fork函数不同于其他函数,在于它可能会有两个或是多个返回值,而且是同时返回两个值。继续分析上面的例子。 理解上例的关键在于fork()的返回点在哪里。Fork()同时返回两个值。其中pid=0的这个返回值用来执行子进程的代码,而大于0的一个返回值为父进程的代码块。第一次fork调用的时候生叉分为两个进程,假设为a父进程和b子进程。他们分别各自在第二次fork调用之前打印了b和a各一次;在第一次叉分的这两个进程中都含有 if((b_pid=fork())0) // 一定要有红色括号!! 没有的话就b_pid永远等于0{printf("error!");}else if(b_pid==0)

printf("c/n");elseprintf("e/n");

这段代码。很明显,a父进程和b子进程在这段代码中又各自独立的被叉分为两个进程。这两个进程每个进程又都打印了e,c各一次。到此,在程序中总共打印两次c,e和一次a,b。总共6个字母。

注:在第一次叉分为两个进程的时候父子进程含有完全相同的代码(第二次仍然相同),只是因为在父子进程中返回的PID的值不同,父进程代码中的PID的值大于0,子进程代码中的值等于0,从而通过if这样的分支选择语句来执行各自的任务。 当然在使用fork中还有很多细节,比如输出时,对缓冲区的不同处理会使父子进程执行过程中输出不同,以及fork后,子进程的exec和exit的一些实现细节。以后再说。

相关推荐

网友评论

  • (*)

最新评论

  • 访客 2022-09-12 09:27:16 回复

    ,在fork之后,他们分别作不同的工作,也就是分岔了。这也是fork为什么叫fork的原因。至于哪一个先运行,与操作系统的调度算法有关,而且这个问题在实际应用中并不重要,如果需要父子进程协同,可以通过原语的办法实现同步来加以解决。 为了加深理解,看下面例子:#include

    1
  • 访客 2022-09-12 13:59:24 回复

    且步调一致,在fork之后,他们分别作不同的工作,也就是分岔了。这也是fork为什么叫fork的原因。至于哪一个先运行,与操作系统的调度算法有关,而且这个问题在实际应用中并不重要,如果需要父子进程协同,可以通过原语的办法实现同步来加以解决。 为

    2
  • 访客 2022-09-12 12:35:10 回复

    c调用一个新脚本以后, 父脚本中exec行之后的内容就不会再执行了。这是exec和source的区别1.sh 代码: #!/bin/bash A=B echo "PID for 1.sh before exec/source/fork: $$" export A ec

    3
  • 访客 2022-09-12 14:58:02 回复

    。进程表里再通过一个称为“程序计数器(program counter, pc)”的寄存器来完成“上下文的切换”。(实际的上下文交换需要涉及到更多的数据,和fork无关,不再多说,PC主要用于指出程序当前已经执行到哪里,是进程上下文的重要内容,换出CPU的进程要保存这个

    4