以下是针对您提供的关于进程的笔记内容的整理和解释。我将以清晰的结构帮助您逐步理解这些操作系统概念。内容基于标准的操作系统知识,确保真实可靠。
1. 进程的含义
进程是一个程序在执行过程中的动态实体,它涉及内存资源的分配和 CPU 的调度。进程的核心是PCB(Process Control Block),这是一个系统维护的结构体,用于存储进程的状态信息。PCB 包含了进程的元数据和执行上下文,确保系统能有效地管理和调度进程。
PCB 中的关键内容
PCB 存储了多种信息,包括但不限于:
- PID(进程标识符):唯一标识进程的数字。
- 当前工作路径(chdir):进程当前所在的目录路径。
- umask:文件创建时的默认权限掩码,例如
0002。 - 进程打开的文件列表:在文件 I/O 操作中提到的文件句柄。
- 信号相关设置:处理异步 I/O 和信号的配置。
- 用户 ID 和组 ID:进程的所有者和所属组,用于权限控制。
- 进程资源的上限:通过命令
ulimit -a可以显示这些上限,如内存、文件描述符等资源限制。
2. 进程与程序的区别
程序是静态的代码和数据集合,存储在硬盘中;而进程是程序执行的动态过程,包括创建、调度和消亡。关键区别包括:
- 持久性:程序是永存的(例如,
.c文件编译成a.out),进程是临时的(例如,运行a.out生成进程 PID)。 - 状态变化:进程有状态变化(如就绪、执行、阻塞),程序没有。
- 并发性:进程可以并发运行(宏观并行),程序本身不具备并发性。
- 资源竞争:进程间会竞争计算机资源(如 CPU、内存),而程序只是代码。
- 关系:一个程序可以运行多次生成多个进程(如多次运行
a.out);一个进程可以运行一个或多个程序(如通过系统调用)。
3. 虚拟内存
虚拟内存是操作系统提供的一种机制,用于隔离和保护进程的内存空间:
- 隔离性:在多进程环境中,一个进程(如进程 A)不能直接访问另一个进程(如进程 B)的内存空间,防止数据冲突。
- 安全性:Linux 内核运行在内存中,通过权限控制限制进程对内核的访问(非任意访问)。
- 内存分布:在 Linux 中,虚拟地址空间分为:
0-3G:用户空间,供进程使用。3G-4G:内核空间,供操作系统使用。
- 地址映射:虚拟地址通过 MMU(内存管理单元)映射到物理内存或虚拟内存,页大小通常为
4K。
4. 进程分类
基于功能和用途,进程可分为三类:
- 交互式进程:用户交互式任务,如命令行工具。
- 批处理进程:自动化任务,如 shell 脚本。
- 守护进程:后台服务,持续运行(如系统守护进程)。
进程的主要作用是实现并发:操作系统在一个时间段内同时运行多个任务的能力。例如,一个进程可能包含多个循环(如while(1)),并发执行不同任务(如处理视频和用户输入)。
5. 进程的状态
进程的状态描述了其执行阶段:
- 基本状态模型(三状态):
- 就绪态:进程准备运行,等待 CPU 分配。
- 执行态:进程正在运行。
- 阻塞态:进程等待资源(如 I/O),处于睡眠状态。
- Linux 扩展状态:
- 运行态:正在执行。
- 睡眠态:等待事件。
- 僵尸态:进程已终止,但父进程尚未回收。
- 暂停态:被信号暂停(如
SIGSTOP)。
6. 进程调度与上下文切换
由于系统中多个进程竞争有限的 CPU 资源,操作系统需要调度策略:
- 调度算法:常见算法包括时间片轮转(每个进程运行固定时间)、短任务优先(优先调度短进程)、优先级调度、完全公平调度算法(CFS)。
- 并发机制:宏观上并行(多个进程在时间段内同时运行),微观上串行(某一时刻只有一个进程运行)。
- 上下文切换:当进程的时间片耗尽(如从进程 A 切换到 B),系统保存当前进程的状态(PCB、寄存器、PC 等)到内存或硬盘,并加载下一个进程的状态。这确保了进程间的无缝切换。
相关命令
ps aux:显示所有进程的详细信息。top:Linux 的任务管理器,实时监控进程。kill:发送信号给进程,如kill -9 PID强制终止指定进程。killall -9 a.out:终止所有名为a.out的进程。
7. 相关函数
以下是进程操作的关键函数:
fork()
pid_t fork(void);- 功能:创建一个子进程。一次调用返回两次(父进程和子进程各返回一次)。执行顺序不确定(子进程或父进程先运行)。变量不共享。
- 细节:子进程复制父进程的用户空间(
0-3G)和 PCB,但 PID 不同。子进程从fork后开始执行,与父进程共享相同代码逻辑。 - 返回值:
- 父进程:成功时返回子进程 PID(
>0),失败返回-1。 - 子进程:成功时返回
0,失败无返回值。
- 父进程:成功时返回子进程 PID(
getpid()
pid_t getpid(void);- 功能:获取调用进程的 PID。
- 参数:无。
- 返回值:进程的 PID。
getppid()
pid_t getppid(void);- 功能:获取调用进程的父进程 PID。
- 参数:无。
- 返回值:父进程的 PID。
这个解释覆盖了您提供的所有关键点。如果您有特定问题或需要更深入讨论某个部分,请随时补充!