우선 커널 레벨 스레드와 사용자 레벨 스레드의 개념부터 파악해보자.
사용자 레벨 스레드는 말그대로 우리가 #include <thread> 혹은 import를 통해 스레드를 이용하는 것을 의미한다.
커널 레벨 스레드는 커널 내에 있는 스레드를 의미하게 되고 위와같이 3가지 방법으로 나뉜다.
1. Pure user-level
커널 스레드 1개당 사용자 스레드 n개를 의미한다. 즉, 1 : n 방식이다.
이 방식같은 경우에는 커널은 사용자 스레드가 100개가 있어도 전혀 모르기 때문에 사용자 스레드에서 I/O가 하나라도 발생하면 해당 프로세스는 I/O가 풀릴 때 까지 영원히 block된다.
2. Pure Kernel-level
n개의 커널 스레드가 n개의 사용자 스레드를 담당하게 된다. 즉 1:1 방식이다.
1:1 방식이기에 병렬성은 좋으나 효율성 면에서 다소 떨어진다.
3. Combined
커널 스레드와 사용자 스레드를 혼합하여 사용하는 방식이다.
위의 두 방식의 장점을 혼합한 방식이라 생각 할 수 있다.
커널 레벨 스레드
- 커널 스레드는 가장 가벼운 커널 스케쥴링 단위다.
- 하나의 프로세스는 적어도 하나의 커널 스레드를 가지게 된다.
- 커널 영역에서 스레드 연산을 수행하게 된다.
- 커널이 스레드를 관리하기 때문에 커널에 종속적이다.
- 프로그래머 요청에 따라 스레드를 생성하고 스케줄링하는 주체가 커널이면 커널 레벨(Kernel Level) 스레드라고 한다.
커널 레벨 스레드 장점
- 프로세스의 스레드들을 몇몇 프로세서에 한꺼번에 디스패치 할 수 있기 때문에 멀티프로세서 환경에서 매우 빠르게 동작한다.
- 다른 스레드가 입출력 작업이 다 끝날 때까지 다른 스레드를 사용해 다른 작업을 진행할 수 있다.- 커널이 각 스레드를 개별적으로 관리할 수 있다.
- 커널이 직접 스레드를 제공해 주기 때문에 안정성과 다양한 기능이 제공된다.
커널 레벨 스레드 단점
- 스케줄링과 동기화를 위해 커널을 호출하는데 무겁고 오래걸린다.(저장한 내용을 다시 불러오는 과정이 필요)
- 즉, 사용자 모드에서 커널 모드로의 전환이 빈번하게 이뤄져 성능 저하가 발생한다.
- 사용자가 프로그래밍할 때 구현하기 어렵고 자원을 더 많이 소비하는 경향이 있다.
사용자 레벨 스레드
- 사용자 영역에서 스레드 연산을 수행한다.
- 사용자 영역에서 스레드 연산을 수행하기 때문에 운영체제에 투명하다.
- 커널에 의존적이지 않은 형태로 스레드의 기능을 제공하는 라이브러리를 활용하는 방식이 사용자 레벨(User Level) 스레드다.
사용자 레벨 스레드 장점
- 운영체제에서 스레드를 지원할 필요가 없다.
- 스케줄링 결정이나 동기화를 위해 커널을 호출하지 않기 때문에 인터럽트가 발생할 때 커널 레벨 스레드보다 오버헤드가 적다.
- 즉, 위의 말은 사용자 영역 스레드에서 행동을 하기에 OS Scheduler의 context switch가 없다(유저레벨 스레드 스케줄러를 이용).
- 커널은 사용자 레벨 스레드의 존재조차 모르기 때문에 모드 간의 전환이 없고 성능 이득이 발생한다
사용자 레벨 스레드 단점
- 시스템 전반에 걸친 스케줄링 우선순위를 지원하지 않는다. (무슨 스레드가 먼저 동작할 지 모른다.)
- 프로세스에 속한 스레드 중 I/O 작업등에 의해 하나라도 블록이 걸린다면 전체 스레드가 블록된다.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 | #include <iostream> #include <thread> using namespace std; void func() { while (1) {} } int main() { thread t1(func); thread t2(func); t1.join(); t2.join(); return 0; } // This source code Copyright belongs to Crocus // If you want to see more? click here >> | Crocus |
위의 코드를 돌리면 위의 그림처럼 결과가 나온다.
현재 위의 코드는 총 3개의 스레드(메인 스레드, t1, t2)가 돌고 있다.
메인 스레드는 join상태이므로 TID 3937의 CPU 점유율이 0%임을 알 수 있다.
하지만 t1과 t2는 현재 CPU를 점유하고 PSR(각 CPU 번호)가 1번, 0번임을 알 수 있다.
알수있는 점(가상 머신에서 2cpu를 적용해두었다.)
- 현재 커널 스레드가 1개 이상이 존재함을 알 수있다.
- 커널 스레드 여러개가 하나의 프로세스를 맡아주고 있기에 두개의 프로세서(CPU)가 하나의 프로세스에서 동작함을 알 수 있다.
- 즉, 하나의 프로세스에는 여러 CPU가 함께 참여 할 수 있음을 알 수 있다.(흔히 대학교에서 배우는 1CPU의 개념과는 좀 다른 것 같다.)
'Applied > Operating System(OS)' 카테고리의 다른 글
CPU,GPU, GPGPU (0) | 2018.09.30 |
---|---|
뮤텍스(Mutex), 세마포어(Semaphore), 모니터(Monitor) (0) | 2018.05.05 |
thread를 이용한 Unsafe Region 관찰 (0) | 2018.02.27 |
unique_lock를 이용한 Producer and Consumer (0) | 2018.02.27 |
OS 정의 그리고 I/O 정리 (0) | 2017.12.12 |