Contents
  1. 1. 概念
  2. 2. 进程与线程的区别
  3. 3. 进程间通信(IPC, Inter-Process Communication)
  4. 4. 线程间通信
  5. 5. 线程共享资源和独享资源
  6. 6. 进程及线程如何实现
  7. 7. 线程管理
    1. 7.1. 内核线程
      1. 7.1.1. 管理方式
      2. 7.1.2. 优点和缺点:
    2. 7.2. 用户态线程
      1. 7.2.1. 管理方式
      2. 7.2.2. 优点及缺点
    3. 7.3. 现代操作系统的线程实现模型
    4. 7.4. 线程从用户态切换到内核态

概念

线程:是操作系统能够进行运算调度的最小单位,是进程的一个执行流程,一个进程可以运行多个线程。

进程:一个执行中的程序的实例

进程与线程的区别

  • 一个程序至少有一个进程,一个进程至少有一个线程
  • 线程的划分尺度小于进程,是的多线程程序的并发性高。
  • 另外,进程在执行过程中拥有独立的内存单元,而多个线程共享内存,从而极大地提高了程序的运行效率。
  • 线程在执行过程中与进程还是有区别的。每个独立的线程有一个程序运行的入口、顺序执行序列和程序的出口。但是线程不能独立执行,必须依存在应用程序中,由应用程序提供多个线程执行控制。
  • 从逻辑角度来看,多线程的意义在于一个应用程序中,有多个执行部门可以同时执行。但操作系统并没有将多个线程看作多个独立的应用,来实现进程的调度和管理以及资源分配。这就是进程和线程的重要区别。
  • 进程是具有一定独立功能的程序关于某个数据集合上的一次运行活动,进程是系统进行资源分配和调度的一个独立单位。
  • 线程是进程的一个实体,是CPU调度和分派的基本单位,它是比进程更小的能独立运行的基本单位,线程自己基本上不拥有系统资源,只拥有一点在运行中必不可少的资源(如程序计数器,一组寄存器和栈),但是它可与同属一个进程的其他的线程共享进程所拥有的全部资源。
  • 一个线程可以创建和撤销另一个线程;同一个进程中的多个线程之间可以并发执行

总结

进程和线程的主要差别在于他们是不同的操作系统资源管理方式,进程有独立的地址空间,一个进程崩溃后,在保护模式下不会对其他进程产生影响,而线程只是一个进程中的不同执行路径。线程有自己的堆栈和局部变量,但线程之间没有单独的地址空间,一个线程死掉就等于整个进程死掉,所以多进程的程序要比多线程的程序健壮,但在进程切换时,耗费资源较大,效率要差一些。对于一些要求同时进行并且又要共享某些变量的并发操作,只能用线程,不能用进程。

线程一般是new出来的,而进程一般fork某个母体而产生的。

进程间通信(IPC, Inter-Process Communication)

在linux下进程间通信的几种主要手段简介:

  1. 管道(Pipe)及有名管道(named pipe):管道可用于具有亲缘关系进程间的通信,有名管道克服了管道没有名字的限制,因此,除具有管道所具有的功能外,它还允许无亲缘关系进程间的通信;
  2. 信号(Signal):信号是比较复杂的通信方式,用于通知接收进程有某种事件发生,除了用于进程间通信外,进程还可以发送信号给进程本身;linux除了支持Unix早期信号语义函数signal外,还支持语义符合Posix.1标准的信号函数sigaction(实际上,该函数是基于BSD的,BSD为了实现可靠信号机制,又能够统一对外接口,用signaction函数重新实现了signal函数);
  3. 消息队列(message queue):消息队列是消息的链接表,包括Posix消息队列和system V消息队列。有足够权限的进程可以向队列中添加消息,被赋予读权限的进程可以读走队列中的消息。消息队列克服了信号承载信息量少,管道只能承载无格式字节流以及缓冲区大小受限等缺点。
  4. 共享内存(shared memory):使得多个进程可以访问同一块内存空间,是最快的可用IPC形式。是针对其他通信机制运行效率较低而设计的。往往与其他通信机制,如信号量结合使用,来达到进程间的同步及互斥。
  5. 信号量(semaphore):主要作为进程间以及同一进程不同线程之间的同步手段。
  6. 套接字(Socket):更为一般的进程间通信机制,可用于不同机器之间的进程间通信。起初是Unix系统的BSD分支开发出来的,但现在一般可以一直到其他类Unix系统上:Linux和System V的变种都支持套接字。

线程间通信

  1. 锁机制:包括互斥锁、条件变量、读写锁
    • 互斥锁提供了以排他方式防止数据结构被并发修改的方法
    • 读写锁允许多个线程同时读共享数据,而对写操作是互斥的
    • 条件变量可以以原子的方式阻塞进程,直到某个特定条件为真为止。对条件的测试是在互斥锁的保护下进行的。条件变量始终与互斥锁一起使用
  2. 信号量机制(Semaphore):包括无名线程信号量和命令线程信号量
  3. 信号机制(Signal):类似进程间的信号处理

线程间的通信目的主要用于线程同步,所以线程没有像进程通信中的用于数据交换的通信机制

线程共享资源和独享资源

线程共享资源线程独享资源
地址空间程序计数器
全局变量r寄存器
打开的文件
子进程状态字
闹铃
信号及信号服务程序
记账信息

进程及线程如何实现

  • 首先,进程的调度及创建都是由操作系统实现的,所以说进程的实现只能由操作系统内核来实现,而不存在用户态实现的情况。

  • 但是对于线程就不同了,线程的管理者可以是用户也可以是操作系统本身,线程是进程内部的东西,当然存在由进程直接管理线程的可能性。

  • 因此线程的实现就应该分为内核态线程实现和用户态线程实现。

线程管理

内核线程

管理方式

首先操作系统像管理进程一样,应该保持维护线程的所有资源,将线程控制块存放在操作系统的内核空间中,此时操作系统就同时掌管进程控制块和线程控制块。

优点和缺点:

优点是用户编程简单,如果一个线程执行阻塞操作,操作系统可以从容地调度另外一个线程的执行

缺点是效率低,因为线程在内核态实现,每次线程切换都需要陷入到内核,由操作系统来调度,而由用户态切换到内核态是要花费很多时间的,另外内核态实现会占用内核稀有的资源,因为操作系统要维护线程列表,操作系统所占内核空间一旦装载后就无法动态改变,并且线程的数量远远大于进程的数量,随着线程数的增加内核将耗尽;内核态的实现需要修改操作系统,这个是谁都不想要做的事情

用户态线程

管理方式

用户态管理线程就是用户自己做线程的切换,自己管理线程的信息,操作系统无需知道线程的存在。

在用户态下进行线程的管理需要用户创建一个调度线程。一个线程在执行完一段时间后主动把资源释放给其它线程使用,而在内核态则无需如此,因为操作系统能够可通过周期性的时钟中断把控制权夺过来,在用户态实现情况下,执行系统的调度器也是线程,没有能力夺取控制权。

优点及缺点

优点是灵活,因为操作系统不用知道线程的存在,所以任何操作系统上都能应用;其次,线程切换快,因为切换在用户态进行,无需陷入带内核态;再次,不用修改操作系统实现容易

缺点是首先编程起来很诡异,由于在用户台下各个进程间需要相互合作才能正常运转。那么在编程时必须考虑什么情况下让出CPU,让其他的线程运行,而让出时机的选择对线程的效率和可靠性有很大影响,这个并不容易做到;

其次,用户态线程实现无法完全达到线程提出所要达到的目的:

进程级多道编程:如果在执行过程中一个线程受阻,它将无法将控制权交出来,这样整个进程都无法推进。操作系统随即把CPU控制权交给另外一个进程。这样,一个线程受阻造成整个进程受阻,我们期望的通过线程对进程实施分身的计划就失败了。这是用户态线程致命的缺点。

调度器激活:线程阻塞后,CPU控制权交给了操作系统,要激活受阻进程的线程,唯一的办法就是让操作系统在进程切换时先不切换,而是通知受阻的进程执行系统(即调用执行系统),并问其是否还有别的线程可以执行。如果有,将CPU控制权交给该受阻进程的执行系统线程,从而调度另一个可以执行的线程到CPU上。一个进程挂起后,操作系统并不立即切换到别的进程上,而是给该进程二次机会,让其继续执行。如果该进程只有一个线程,或者其所有线程都已经阻塞,则控制权将再次返回给操作系统。而现在,操作系统就会切换到其他线程了。

现代操作系统的线程实现模型

鉴于用户态与内核态都存在缺陷,现代操作系统将两者结合起来。用户态的执行负责进程内部线程在非阻塞时的切换;内核态的操作系统负责阻塞线程的切换,即我们同时实现内核态和用户态线程管理。每个内核态线程可以服务一个或者多个用户态线程。

线程从用户态切换到内核态

首先,如果在程序运行过程中发生中断或者异常,系统将自动切换到内核态来运行中断或异常处理机制;此外,程序进行系统调用也会从用户态切换到内核态

Contents
  1. 1. 概念
  2. 2. 进程与线程的区别
  3. 3. 进程间通信(IPC, Inter-Process Communication)
  4. 4. 线程间通信
  5. 5. 线程共享资源和独享资源
  6. 6. 进程及线程如何实现
  7. 7. 线程管理
    1. 7.1. 内核线程
      1. 7.1.1. 管理方式
      2. 7.1.2. 优点和缺点:
    2. 7.2. 用户态线程
      1. 7.2.1. 管理方式
      2. 7.2.2. 优点及缺点
    3. 7.3. 现代操作系统的线程实现模型
    4. 7.4. 线程从用户态切换到内核态