세부 장치라고 하면 '고성능 코어(P-core)'나 '효율 코어(E-core)' 같은 명칭이 떠오를 것 같지만, 사실 이 코어들 하나하나가 내부적으로 ALU, 제어 장치, 캐시 메모리로 구성되어 있다.
코어가 특수한 목적을 가진 큰 방(예: 전문 주방)이라면, ALU/제어 장치/캐시는 그 방 안에 있는 가구와 설비(가스레인지, 요리사, 냉장고)에 해당한다. 코어는 다음과 같은 종류가 있다:
1. P코어 (고성능): 거대한 제어 장치(예측 연산)와 대용량 캐시(빠른 기억), 어려운 작업 하나를 최대한 빨리 끝내도록 설계됨
2. E코어 (효율): 제어 장치와 캐시 규모를 줄여, 전력을 적게 쓰면서 배경 작업을 처리하는 데 집중
3. GPU 코어: 제어 장치는 극도로 작고 캐시도 거의 없지만, ALU를 수백 개씩 넣음
CPU의 구성
ALU (Arithmetic Logic Unit) ALU는 산술·논리 연산 장치로, 덧셈, 뺄셈, 비교 등 모든 연산을 처리함
Control Unit 제어 장치는 명령어를 해석하고 다른 구성 요소에 동작을 지시함
Registers 레지스터는 CPU 내부의 초고속 임시 저장 공간, 즉시 처리할 데이터를 보관
Branch Predictor 분기 예측 장치는 다음에 실행될 코드 경로를 미리 예측해 처리 지연을 줄임
L1/L2/L3 Caches L1/L2/L3 캐시는 CPU와 RAM 사이에 위치한 다단계 고속 메모리
FPU (Floating Point Unit) FPU(부동소수점 연산 장치)는 3.14나 2.718 같은 실수 연산을 담당
MMU (Memory Management Unit) MMU(메모리 관리 장치)는 가상 메모리 주소를 실제 물리 주소로 변환함
GPU의 구성
Streaming Multiprocessors (SM) 스트리밍 멀티프로세서(SM)는 수천 개의 소형 코어를 포함하며, 엄청난 수의 스레드를 동시에 병렬 실행함
Shared Memory / L1 Cache 공유 메모리/L1 캐시는 각 SM 내부에서 빠르게 공유되는 스크래치패드 메모리
RT Cores / Tensor Cores RT 코어/텐서 코어는 실시간 광선추적과 AI 행렬 연산을 각각 전담하는 특수 하드웨어
VRAM (GDDR/HBM) VRAM(GDDR/HBM)은 GPU 전용 초고대역 메모리로, 그래픽·연산 작업에서 시스템 RAM보다 훨씬 빠름
Warp Scheduler 워프 스케줄러는 스레드를 32개 묶음(워프)으로 그룹화해 실행을 스케줄링함
물리적 구성
각 구성 요소들은 포토리소그래피(사진 식각)라는 공정을 통해 나노미터 단위 크기로 실리콘 웨이퍼 위에 새겨진다.
ALU나 캐시 같은 각 구성 요소는 다이(die) 위의 구분된 물리적 영역으로 칩을 현미경으로 촬영한 다이 샷(die shot) 사진에서 서로 다른 색의 구역으로 실제로 확인 가능하다. 최신 칩(예: TSMC 3nm 공정)의 가장 작은 구조는 DNA 가닥보다도 작다.
엔지니어들이 CPU나 GPU를 설계할 때, 그들은 사실상 수백억 개의 초소형 스위치로 이루어진 도시를 설계하는 것이며, 이 스위치들이 초당 수십억 번의 사이클로 함께 동작한다.
'과학기술' 카테고리의 다른 글
| 연대 측정법 (0) | 2026.04.11 |
|---|---|
| 지구 자기장 역전 (0) | 2026.04.11 |
| DNA 메틸화, 히스톤 아세틸화, 히스톤 메틸화 (0) | 2026.04.07 |
| 철근 콘크리트의 활용 (0) | 2026.04.04 |
| 바제도씨병 (0) | 2026.03.29 |