进程的描述与控制
进程的描述与控制
进程与程序
- 程序是永久的,进程是暂时的。
- 同一程序可以对应多个进程。
- 程序是一个静态的概念。而进程是一个动态的概念。
- 进程是动态的、多个进程可以含有相同的程序、多个进程可以并发运行
- 动态性、并发性、独立性和异步性(不可预知的速度同时向前推进)
- 进程实体由三部分构成:程序段、数据集、进程控制块
- 进程的定义:进程是执行中的程序。
- 进程是程序的执行过程,是系统进行资源分配和调度的一个独立单位。
- 进程实体 = 程序段 + 数据段 + 进程控制块(PCB)
进程的状态
运行态
- 当一个进程已分配到CPU,它的程序正在被CPU执行时进程所处的状态称执行状态,也称为运行状态。对于单CPU系统而言,处于执行状态的进程只可能有一个,多处理机系统中则有多个
就绪态
- 若进程已具备了运行条件,只因CPU被别的进程占用而不能被CPU执行,则称此时进程处于就绪状态。一旦把CPU分配给它,该进程就可以运行。系统中处于就绪状态的进程可能有多个,通常将它们按某种策略(优先级)排成一个队列,称为就绪队列
阻塞态
- 正在执行的进程因等待某种事件的发生而暂时不能运行便放弃CPU的状态称阻塞状态(等待状态、封锁状态),例如,等待输入/输出、等待进程间的同步/互斥等。一旦引起等待的原消失,进程便转为就绪状态。以便在适当的时候占用CPU。系中处于等待状态的进程可能有多个,通常也将它们排成一个列。有的系统按照进程不同的等待原因,把处于等待状态的进程排成多个阻塞队列
创建状态
- 一个进程刚刚建立,但还未将它插入就绪队列时的状态(fork,CreateProcess),通常是PCB已经创建,但还没有加载到内存中
终止状态
- 一个进程已经正常结束(exit,TerminateProcess)或异常结束,
OS已将它从就绪队列中移出,但尚未将它撤消时的状态
- 一个进程已经正常结束(exit,TerminateProcess)或异常结束,
新建→就绪
- 许可(加载):操作系统准备好接纳一个新进程
- 不许可:超过操作系统最大进程/虚存数量限制
就绪→运行
- 调度:调度进程选择一个新进程运行
运行→结束
- 释放:进程已经完成,或出错结束
运行→阻塞
- 等待事件:请求系统调用,如
- 等待I/O操作完成(printf、scanf)
- 等待新任务的到来(等待网络发数据包)
- 访问暂不能被使用的资源(其他进程正在使用打印机)
- 等待另一个进程提供输入(wait)
- 申请外设
阻塞→就绪
- 事件发生:如I/O完成
运行→就绪
- 时间片到:Linux-5~800ms;Windows-20ms
- 抢占(preempted):更高优先级进程已就绪
- 自愿释放:如周期性维护进程
挂起状态
使正在执行的进程暂停执行;若此时进程正处于就绪状态而未执行,则该进程暂不接受调度,我们把这种静止状态称为挂起(suspend)状态。
引入挂起状态的原因有:
- 交换(Swapping) 操作系统需要释放内存空间,调节负荷
- 其他OS原因 OS挂起后台进程、工具进程,或怀疑有问题的进程
- 用户请求 用户希望调试进程或连接进程资源
- 父进程请求 挂起后代进程,以便考查修改,或协调子进程的活动
- 定时 周期性的记账或系统监视进程
进程控制块
进程控制块PCB(Process Control Block)记录了操作系统所需的,用于描述进程的当前情况以及管理进程的全部信息,是操作系统中最重要的记录型数据结构。
对系统而言,PCB是进程存在的惟一标志。
PCB常驻内存。操作系统将所有的PCB组织成若干个队列,存放在系统内核空间中专门开辟的区域内
进程标识符 用于唯一标识一个进程。
- 内部标识符 操作系统为每一个进程赋予一个惟一的
- 数字标识符(进程的序号,Process ID,PID )
- 用户标识符(User ID,UID)
- 父进程标识符(Parent PID,PPID
处理机状态信息 又称上下文(Context)
- 通用寄存器(General Purpose Registers),又称用户可见寄存器,8~32个/CISC,100+个/RISC
- 程序计数器(Program Counter),指令计数器,存放下一条指令的地址
- 程序状态字(Program State Word),存放状态信息,如x86的EFLAGS
- 栈指针(Stack Pointer),指向栈顶
进程调度信息
- 进程状态:运行、就绪、等待、停止……
- 优先级
- 事件:在等待的具体事件,即阻塞原因
- 其它信息:已等待时间,已使用CPU时间
进程控制信息
- 内存相关:程序和数据的(首)地址、段表、页表
- 进程间通信:标记、信号量、消息队列……
- 资源清单:打开的文件、设备……
- 连接指针:指向其它PCB
进程(仅概念)
进程的创建
引起创建进程的事件
- 用户登录(由系统内核创建)
- 作业调度(由系统内核创建)
- 提供服务(由系统内核创建)
- 应用请求(由应用进程自已创建)
- 子进程与父进程的关系可以是并发或递归
创建进程的基本过程:创建原语Creat
(1)申请空白PCB;
(2)为新进程的程序和数据分配所需资源(内存、文件、I/O和CPU时间)
(3)初始化PCB。向该PCB中填写各种参数;
(4)New→Ready,将新进程插入到就绪队列。
进程的终止
- 正常结束 进程任务已完成,退出运行。
- 异常结束 如:越界错误、无可用内存、保护错、无效指令、特权指令错、超时、算术运算错、I/O故障等
- 外界干预 进程应外界的请求而终止运行。包括:操作员或操作系统干预、父进程请求、父进程终止。
进程的终止过程是: 终止原语Halt
(1)根据进程PID检索出该进程的PCB,读出进程状态
(2)若进程处于执行状态,立即终止(Run→Terminate),并重新进行调度
(3)某些系统可能将其子孙进程终止
(4)把进程拥有的资源归还给父进程或者系统内核
(5)等待其他程序来搜集信息。
进程的阻塞
引起进程阻塞的事件
- 请求系统提供服务
- 启动某种操作
- 新数据尚未到达
- 无新工作可做
进程的阻塞(等待)过程 阻塞(等待)原语block
(1) 进程立即停止执行,把其PCB中的状态Run→Blocked;
(2) 将其PCB插入到相应的阻塞队列中去;
(3) 转调度程序进行重新调度,并进行切换
进程的唤醒
引起进程唤醒的事件——被阻塞进程所期待的事件出现
进程的唤醒过程:唤醒原语wakeup
(1) 把被阻塞进程从相应事件的阻塞队列中移出;
(2) 将其PCB中的状态由Blocked→Ready;
(3) 该PCB插入到就绪队列中。
进程通信
合作的进程通过进程间通信机制实现数据和信息的交换的锁、信号量、管程等同步机制,都可以交换进程的信息,也属于进程通信(但是传输的信息量很小,称为低级通信)
高级通信机制:
- 共享内存:进程通过共享某些数据结构或内存区域通信,程序员负责处理同步问题
- 消息传递:以格式化的消息(message)为单位,用户通过OS提供的一组通信原语(send, receive)进行通信。当前应用最广泛的IPC机制
- 直接通信
- send (P, message) – 发送信息到进程P
- receive(Q, message) – 从进程Q接受消息
- 间接通信(借助中介数据结构)
- send(A, message) – 发送消息(信件)到队列A
- receive(A, message) – 从队列A接受消息(信件)
- 信���通信:A=mailbox
- 直接通信
- 管道通信:用一个共享文件连接一个读进程和一个写进程采用先进先出(FIFO)机制的循环队列/缓冲区管道通信机制必须提供互斥、同步和确定对方是否存在的协调能力
- 客户机-服务器系统:在网络环境的各种应用中已经成为主流
主要实现方法- 套接字(Socket)
- 远程过程调用(Remote Procedure Call, RPC)
线程
进程 = 一个资源 + 多个指令执行序列(即多个线程)
只切换指令执行序列,而不切换资源保留了并发的优点,避免了进程切换代价
它是进程中的指令执行流的最小单元,是CPU调度的基本单位。
现代操作系统将进程并发调度的部分和占有资源的部分分离
进程作为资源分配的基本单位
线程作为系统调度的基本单位,是能独立运行的基本单元(线程可以并行在多核处理器上)
- 资源共享:默认共享地址空间、文件等
- 响应性:拆分应用中的多种活动
- 考虑字处理程序
- 轻量级:创建、撤销、切换线程的代价比进程小
- 可扩展:多个线程可在多CPU系统��并行
- 可以并发
- 线程仅拥有少量自己的资源(寄存器、PC指针、栈指针等上下文信息,不能共享),多是共享的
- 系统开销比进程小
- 独立性比进程小
- TCB(线程控制块)
缺点:任何一个线程出问题,可能导致整个进程崩溃
用户级线程
用户级线程是指不需要内核支持而在用户程序中实现的线程,它的内核的切换是由用户态程序自己控制内核的切换,不需要内核的干涉。但是它不能像内核级线程一样更好的运用多核CPU。
优点:
(1) 线程的调度不需要内核直接参与,控制简单。
(2) 可以在不支持线程的操作系统中实现。
(3) 同一进程中只能同时有一个线程在运行,如果有一个线程使用了系统调用而阻塞,那么整个进程都会被挂起,可以节约更多的系统资源。
缺点:
(1) 一个用户级线程的阻塞将会引起整个进程的阻塞。
(2) 用户级线程不能利用系统的多重处理,仅有一个用户级线程可以被执行。
内核级线程
切换由内核控制,当线程进行切换的时候,由用户态转化为内核态。切换完毕要从内核态返回用户态。可以很好的运用多核CPU,就像Windows电脑的四核八线程,双核四线程一样。
优点:
(1)当有多个处理机时,一个进程的多个线程可以同时执行。
(2) 由于内核级线程只有很小的数据结构和堆栈,切换速度快,当然它本身也可以用多线程技术实现,提高系统的运行速率。
缺点:
(1) 线程在用户态的运行,而线程的调度和管理在内核实现,在控制权从一个线程传送到另一个线程需要用户态到内核态再到用户态的模式切换,比较占用系统资源。(就是必须要受到内核的监控)
关联性
(1) 它们之间的差别在于性能。
(2) 内核支持线程是OS内核可感知的,而用户级线程是OS内核不可感知的。
(3) 用户级线程的创建、撤消和调度不需要OS内核的支持。
(4) 用户级线程执行系统调用指令时将导致其所属进程被中断,而内核支持线程执行系统调用指令时,只导致该线程被中断。
(5) 在只有用户级线程的系统内,CPU调度还是以进程为单位,处于运行状态的进程中的多个线程,由用户程序控制线程的轮换运行;在有内核支持线程的系统内,CPU调度则以线程为单位,由OS的线程调度程序负责线程的调度。
(6) 用户级线程的��序实体是运行在用户态下的程序,而内核支持线程的程序实体则是可以运行在任何状态下的程序。