반응형


우선 커널 레벨 스레드와 사용자 레벨 스레드의 개념부터 파악해보자.



사용자 레벨 스레드는 말그대로 우리가 #include <thread> 혹은 import를 통해 스레드를 이용하는 것을 의미한다.


커널 레벨 스레드는 커널 내에 있는 스레드를 의미하게 되고 위와같이 3가지 방법으로 나뉜다.


1. Pure user-level


커널 스레드 1개당 사용자 스레드 n개를 의미한다. 즉, 1 : n 방식이다.

이 방식같은 경우에는 커널은 사용자 스레드가 100개가 있어도 전혀 모르기 때문에 사용자 스레드에서 I/O가 하나라도 발생하면 해당 프로세스는 I/O가 풀릴 때 까지 영원히 block된다.


2. Pure Kernel-level


n개의 커널 스레드가 n개의 사용자 스레드를 담당하게 된다. 즉 1:1 방식이다.

1:1 방식이기에 병렬성은 좋으나 효율성 면에서 다소 떨어진다.


3. Combined


커널 스레드와 사용자 스레드를 혼합하여 사용하는 방식이다.

위의 두 방식의 장점을 혼합한 방식이라 생각 할 수 있다.



커널 레벨 스레드


- 커널 스레드는 가장 가벼운 커널 스케쥴링 단위다. 

- 하나의 프로세스는 적어도 하나의 커널 스레드를 가지게 된다. 

- 커널 영역에서 스레드 연산을 수행하게 된다.

- 커널이 스레드를 관리하기 때문에 커널에 종속적이다.

- 프로그래머 요청에 따라 스레드를 생성하고 스케줄링하는 주체가 커널이면 커널 레벨(Kernel Level) 스레드라고 한다.


커널 레벨 스레드 장점


프로세스의 스레드들을 몇몇 프로세서에 한꺼번에 디스패치 할 수 있기 때문에 멀티프로세서 환경에서 매우 빠르게 동작한다.

- 다른 스레드가 입출력 작업이 다 끝날 때까지 다른 스레드를 사용해 다른 작업을 진행할 수 있다. 

- 커널이 각 스레드를 개별적으로 관리할 수 있다. 

- 커널이 직접 스레드를 제공해 주기 때문에 안정성과 다양한 기능이 제공된다.


커널 레벨 스레드 단점


- 스케줄링과 동기화를 위해 커널을 호출하는데 무겁고 오래걸린다.(저장한 내용을 다시 불러오는 과정이 필요)

- 즉, 사용자 모드에서 커널 모드로의 전환이 빈번하게 이뤄져 성능 저하가 발생한다.

- 사용자가 프로그래밍할 때 구현하기 어렵고 자원을 더 많이 소비하는 경향이 있다.




사용자 레벨 스레드


- 사용자 영역에서 스레드 연산을 수행한다. 

- 사용자 영역에서 스레드 연산을 수행하기 때문에 운영체제에 투명하다. 

- 커널에 의존적이지 않은 형태로 스레드의 기능을 제공하는 라이브러리를 활용하는 방식이 사용자 레벨(User Level) 스레드다.



사용자 레벨 스레드 장점


- 운영체제에서 스레드를 지원할 필요가 없다. 

- 스케줄링 결정이나 동기화를 위해 커널을 호출하지 않기 때문에 인터럽트가 발생할 때 커널 레벨 스레드보다 오버헤드가 적다.

- 즉, 위의 말은 사용자 영역 스레드에서 행동을 하기에 OS Scheduler의 context switch가 없다(유저레벨 스레드 스케줄러를 이용).

- 커널은 사용자 레벨 스레드의 존재조차 모르기 때문에 모드 간의 전환이 없고 성능 이득이 발생한다



사용자 레벨 스레드 단점


- 시스템 전반에 걸친 스케줄링 우선순위를 지원하지 않는다. (무슨 스레드가 먼저 동작할 지 모른다.)

- 프로세스에 속한 스레드 중 I/O 작업등에 의해 하나라도 블록이 걸린다면 전체 스레드가 블록된다.






1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
#include <iostream>
#include <thread>
 
using namespace std;
 
void func() {
    while (1) {}
}
 
int main() {
    thread t1(func);
    thread t2(func);
 
    t1.join();
    t2.join();
 
    return 0;
}
 
//                                                       This source code Copyright belongs to Crocus
//                                                        If you want to see more? click here >>
Crocus


위의 코드를 돌리면 위의 그림처럼 결과가 나온다.


현재 위의 코드는 총 3개의 스레드(메인 스레드, t1, t2)가 돌고 있다.


메인 스레드는 join상태이므로 TID 3937의 CPU 점유율이 0%임을 알 수 있다.


하지만 t1과 t2는 현재 CPU를 점유하고 PSR(각 CPU 번호)가 1번, 0번임을 알 수 있다.



알수있는 점(가상 머신에서 2cpu를 적용해두었다.)


- 현재 커널 스레드가 1개 이상이 존재함을 알 수있다.

- 커널 스레드 여러개가 하나의 프로세스를 맡아주고 있기에 두개의 프로세서(CPU)가 하나의 프로세스에서 동작함을 알 수 있다.

- 즉, 하나의 프로세스에는 여러 CPU가 함께 참여 할 수 있음을 알 수 있다.(흔히 대학교에서 배우는 1CPU의 개념과는 좀 다른 것 같다.)



반응형