일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- ar vr 차이
- 서비스 vs 쓰레드
- 스택 자바 코드
- android ar 개발
- rxjava disposable
- android retrofit login
- jvm이란
- 안드로이드 라이선스 종류
- 자바 다형성
- 안드로이드 레트로핏 crud
- 안드로이드 유닛테스트란
- Rxjava Observable
- 안드로이드 유닛 테스트
- ANR이란
- 안드로이드 os 구조
- 큐 자바 코드
- 서비스 쓰레드 차이
- 안드로이드 유닛 테스트 예시
- jvm 작동 원리
- 2022 플러터 안드로이드 스튜디오
- 객체
- 멤버변수
- rxjava cold observable
- 스택 큐 차이
- rxjava hot observable
- 안드로이드 레트로핏 사용법
- 클래스
- 2022 플러터 설치
- 안드로이드 라이선스
- 플러터 설치 2022
- Today
- Total
나만을 위한 블로그
[혼공컴운] 5. CPU 성능 향상 기법 본문
빠른 CPU를 위한 설계 기법
클럭
빠른 CPU를 설계하려면 어떻게 설계해야 하는가? 컴퓨터 부품들은 클럭 신호에 맞춰 움직이고, CPU는 명령어 사이클에 맞춰 명령어들을 실행한다. 클럭 신호가 빠르게 반복되면 CPU를 비롯한 컴퓨터 부품들은 그만큼 빠른 박자에 맞춰 움직일 것이다. 즉 클럭 속도가 높아지면 CPU는 명령어 사이클을 더 빠르게 반복할 거고 다른 부품들도 더 빠르게 작동할 것이다.
클럭 속도는 헤르츠(Hz) 단위로 측정한다. 이건 1초에 클럭이 몇 번 반복되는지를 나타낸다. 클럭이 1초에 100번 반복되면 CPU의 클럭 속도는 100Hz다. 기본 속도가 2.5GHz, 최대 속도가 4.9GHz라면 1초에 기본적으로 25억 번, 순간 최대 49억 번 반복된다는 뜻이다. 그러나 클럭 속도를 무작정 높이면 발열 문제가 심각해진다
코어, 멀티코어
클럭 속도 외에 CPU의 성능을 높이는 방법은 CPU의 코어, 쓰레드 수를 늘리는 방법이 있다. 코어는 무엇인가?
CPU의 정의 중 명령어를 실행하는 부품은 현대에 코어라는 용어로 쓰인다. 즉 CPU는 명령어를 실행하는 부품에서 명령어를 실행하는 부품을 여러 개 포함하는 부품으로 확장됐다. 이 코어를 여럿 포함한 CPU를 멀티코어 CPU라고 부른다. CPU 안에 명령어 처리자가 여러 명 있는 것과 같아서 멀티코어의 처리속도가 단일코어보다 빠르다. 2.4GHz 단일코어 CPU보다 1.9GHz의 멀티코어 CPU가 성능이 더 좋다.
그렇다고 코어를 무작정 늘린다고 CPU 연산 속도가 비례해서 증가하지 않는다. 코어마다 처리할 연산이 적절하게 분배되지 않으면 코어 수에 맞춰 연산 속도가 증가하지 않는다. 또한 처리하려는 작업량보다 코어 수가 지나치게 많아도 성능엔 크게 영향이 없다
쓰레드, 멀티쓰레드
쓰레드에는 CPU에서 쓰는 하드웨어적 쓰레드가 있고 프로그램에서 쓰이는 소프트웨어적 쓰레드가 있다.
- 하드웨어적 쓰레드 : 하나의 코어가 동시에 처리하는 명령어 단위. 하나의 코어로 여러 명령어를 동시 처리하는 CPU를 멀티쓰레드 CPU라고 부른다. 8코어 16쓰레드 CPU의 경우 명령어 실행 부품을 8개 포함하고 한 번에 명령어를 16개 처리할 수 있는 CPU라는 뜻이다
- 소프트웨어적 쓰레드 : 하나의 프로그램에서 독립적으로 실행되는 단위. 프로그래밍 언어, OS를 학습할 때 접하는 쓰레드는 보통 이 쓰레드를 말한다.
명령어 병렬 처리 기법
명령어 파이프라인
명령어 처리 과정을 클럭 단위로 나누면 아래처럼 나눌 수 있다.
- 명령어 인출
- 명령어 해석
- 명령어 실행
- 결과 저장
중요한 건 단계가 겹치지 않으면 CPU는 각 단계를 동시 실행할 수 있다는 것이다. 한 명령어를 인출하는 동안 다른 명령어를 실행하거나, 실행하면서 연산 결과를 저장할 수 있다.
이렇게 명령어들을 명령어 파이프라인에 넣고 동시 처리하는 기법을 명령어 파이프라이닝이라고 한다.
파이프라이닝이 고성능을 가져오지만 특정 상황에선 성능 향상에 실패하는 경우도 있다. 이 상황을 파이프라인 위험이라고 부른다. 파이프라인 위험에는 데이터 위험, 제어 위험, 구조적 위험이 있다.
데이터 위험
명령어 간 데이터 의존성에 의해 발생함. 데이터 의존적인 두 명령어를 무작정 동시 실행하려고 하면 파이프라인이 제대로 작동하지 않는 걸 데이터 위험이라고 한다
제어 위험
분기 등으로 인한 프로그램 카운터의 갑작스런 변화로 발생함. 기본적으로 프로그램 카운터는 현재 실행 중인 명령어의 다음 주소로 갱신된다. 하지만 실행 흐름이 바뀌어서 명령어가 실행되며 프로그램 카운터 값에 갑작스런 변화가 생기면, 명령어 파이프라인에 미리 가져와서 처리 중이던 명령어들이 필요없어진다. 이걸 제어 위험이라고 한다
구조적 위험
명령어들을 겹쳐 실행하는 과정에서 서로 다른 명령어가 동시에 ALU, 레지스터 등 CPU 부품을 사용하려 할 때 발생함. 자원 위험이라고도 부름
슈퍼스칼라
CPU 내부에 여러 명령어 파이프라인을 포함하는 구조. 명령어 파이프라인 하나만 두는 게 생산라인을 1개 두는 것과 같다면 슈퍼스칼라는 생산라인을 여러 개 두는 것과 같다.
슈퍼스칼라 구조로 명령어 처리가 가능한 CPU를 슈퍼스칼라 CPU라고 한다. 이 CPU는 매 클럭 주기마다 동시에 여러 명령어를 인출, 실행할 수도 있어야 한다.
슈퍼스칼라 CPU는 이론적으로 파이프라인 개수에 비례해 처리 속도가 빨라지지만 실제론 반드시 파이프라인 개수에 비례해서 빨라지진 않는다. 그래서 슈퍼스칼라 CPU는 파이프라인 위험 방지를 위해 고도로 설계돼야 한다.
비순차적 명령어 처리(OoOE)
오늘날 CPU 성능 향상에 크게 기여한 기법이고 대부분의 CPU가 차용하는 기법. 명령어들을 순차적으로 실행하지 않는 기법이다.
순서를 바꿔 실행해도 무방한 명령어를 먼저 실행해서 명령어 파이프라인이 멈추는 걸 방지하는 기법을 의미한다
CISC, RISC
명령어 집합
CPU가 이해할 수 있는 명령어들의 모음. 명령어 집합 구조(ISA)라고도 한다. 이는 CPU마다 ISA가 다를 수도 있단 걸 의미한다
CISC
복잡한 명령어 집합을 활용하는 컴퓨터(CPU)의 약자. 명령어 형태, 크기가 다양한 가변 길이 명령어를 활용한다.
적은 수의 명령어로도 프로그램을 작동시킬 수 있어서 메모리 공간을 절약할 수도 있다.
하지만 활용하는 명령어가 복잡하고 다양한 기능을 제공해서 명령어 크기, 실행되기까지의 시간이 일정하지 않다. 그리고 복잡한 명령어 때문에 명령어 하나 실행하는 데 여러 클럭 주기를 필요로 한다. 또한 명령어 규격화가 어려워서 명령어 파이프라이닝이 어렵다
RISC
Reduced Instruction Set Computer의 약자. CISC에 비해 명령어 종류가 적고, 짧고 규격화된 명령어와 되도록 1클럭 내외로 실행되는 명령어를 지향한다. 즉 고정 길이 명령어를 활용한다. 명령어가 규격화되어 있어서 RISC는 명령어 파이프라이닝에 최적화돼 있다.
메모리 접근을 단순화, 최소화하는 대신 레지스터를 적극 활용한다. 그래서 CISC보다 레지스터를 쓰는 연산이 많고 범용 레지스터 개수도 더 많다.
'책 > 혼자 공부하는 컴퓨터 구조 + 운영체제' 카테고리의 다른 글
[혼공컴운] 7. 보조기억장치 (0) | 2023.12.25 |
---|---|
[혼공컴운] 6. 메모리와 캐시 메모리 (0) | 2023.11.18 |
[혼공컴운] 4. CPU의 작동 원리 (0) | 2023.11.07 |
[혼공컴운] 3. 명령어 (0) | 2023.11.04 |
[혼공컴운] 2. 데이터 (0) | 2023.10.31 |