■■▶PC 정비◀ 2010. 10. 9. 00:03
CPU(Central Processing Unit)

ALU, CU : 산술논리장치와 제어장치로 구성

중앙처리장치는 비교, 판단, 연산을 담당하는 산술논리장치(Arithmetic Logic Unit)와 명령어의 해석과 실행을 담당하는 제어장치(Control Unit)로 구성된다.

산술논리장치(ALU)는 각종 덧셈을 수행하고 결과를 수행하는 가산기(adder)와 산술과
논리연산의 결과를 일시적으로 기억하는 레지스터인 누산기(accumulater), 중앙처리장치에 있는 일종의 임시 기억장치인 레지스터(Register) 등으로 구성되어 있다.

제어장치(CU)는 프로그램의 수행 순서를 제어하는 프로그램
계수기(Program Counter), 현재 수행중인 명령어의 내용을 임시 기억하는 명령 레지스터(Instruction register), 명령 레지스터에 수록된 명령을 해독하여 수행될 장치에 제어신호를 보내는 명령해독기(Instruction Decoder)로 이루어져 있다.


 

 

 

 

 


[Intel CPU의 역사]

Micro Processor
각종 전자부품과 반도체 칩을 하나의 작은 칩에 내장하여 각종 연산작용이나 자료를 처리할 수 있도록 만든 부품
1970년대에 선을 보인 후 오늘날 여러 분야에서 매우 중요한 전자부품으로 활용
마이콤이라고도 부름
마이크로프로세서 중에서 PC에 사용되는 것을 CPU라고 한다.

i4004
1971년 개발
세계최초의 MPU(Micro Processor Unit)
전자계산기에 많이 사용
2,250개의 트랜지스터를 집적
4비트 데이터 버스와 12비트 어드레스 버스를 사용(16핀 세라믹 DIP 패키지 형태)
그 이후에 나온 CPU의 원형이 됨
초당 6만 번의 연산, 200달러의 가격

i4040
1972년
4004가 큰 성공을 거두자 4004칩에 몇 가지 기능을 추가한 개선제품
24핀 세라믹 DIP 패키지 형태

i8008
1972년 개발
최초의 8bit MPU
3,300개의 트랜지스터 집적
400의 2배 성능
300KHz의 주파수 속도
8비트 데이터 버스, 14비트 어드레스 버스
18핀 DIP 패키지, Dumb Terminal에 사용

i8080
1973년 개발
8008의 10배 속도
8비트 데이터 버스, 16비트 어드레스 버스
약 4,000개의 트랜지스터
40핀 CERDIP 방식
64KB의 메모리를 이용할 수 있었음
최초의 개인용 컴퓨터라 불리는 알테어에 사용

i8085
1976년 개발

1978년에 등장한 i8086은 기술적으로 볼 때 당대 라이벌(?)이었던 모토롤라의 MC68000에 비해서는 상당히 뒤진 아키텍처를 가지고 있었다. i4004, i8008, i8080, i8085까지 거치면서 1960년대의 누산기 중심의 프로세서 구조를 유지했고 i8086의 경우에도 하위 호환성을 위해 이 구조를 그대로 끌고갔다.

i8086
1978년
최초의 16bit CPU
1MB의 메모리 지원
4.77MHz의 속도(클럭수) 지원
29,000개의 트랜지스터
8086A, 8086AH, 8086AH-2, 8086AH-1, 80C86A,80C86A-2, 80C86A-1으로 발전
나중에 클럭이 12MHz까지 향상되었다.
인텔은 Fortune 선정 500대 기업에 들게 된다.

i8088
1979년(8086의 후속 제품)
내부 16비트 / 외부 8비트 클럭 설계
80C88A, 80C88A-2, 80C88A-1로 발전
최초 4.77MHz 에서 나중에는 10MHz 속도
14개의 레지스터
IBM-PC XT에 탑재(1981년 8월 12일)
절반만 16비트인 CPU

i80186
i80186과 i80188은 주변의 컨트롤러를 합친 형태로 발매되었고 주로 산업용 프로세서로 사용되었다. 일반인은 주로 접할 기회가 없었다. 퀄컴의 CDMA 칩 중에 초창기 칩은 i80186을 베이스로 하여 설계. 1999년 이전에 나온 휴대폰을 사용하셨던 분들은 이 프로세서를 이용하였다.

i80286
1982년
IBM-PC AT( Advanced Technoloy )에 탑재
24비트 어드레스 버스(16MB메모리 관리 가능)
클럭 속도 : 6MHz – 25MHz
68핀 패키지 형태로 제조
리얼 모드 / 프로텍티드 모드 사용
134,000개의 트랜지스터
4단계 병렬처리와 실행유닛 등으로 리얼모드에서도 8088의 3배 이상의 속도

Real Mode / Protected Mode
리얼 모드…8086에서 사용하던 메모리 관리 동작 모드, 즉 1MB의 메모리에서 모든 작업이 수행되는 방식
프로텍티드 모드… 어떤 프로그램이 사용하는 메모리 영역을 다른 프로그램이 침범하지 못하게 함으로써 현재 프로그램이 사용하고 있는 메모리 영역을 보호(멀티태스킹이 가능해졌다.)
MS가 윈도우를 개발하게 된 계기가 됨

i80386
1985년 발표
32비트 CPU
가상모드(Virtual Real Mode, 가상 8086모드)
내부버스, 외부버스, 어드레스 버스가 모두 32비트 -> 4GB의 메모리 관리 가능
275,000개의 트랜지스터
클럭속도 : 16 – 40MHz
페이지 단위로 메모리 관리(이전에는 세그먼트 단위로 관리했었다.)

i80386SX
1988.6.
절반만 32비트로 저가형제품에 사용
--------------------------
80386SL…저전력용 CPU
80386SLC… 8KB의 캐시 내장 제품
사실, CPU의 개발은 80386을 기점으로 한 세대를 마감한 것이나 다름없다. (이후는 속도 경쟁의 시대임)

보조프로세서
(8087, 80287, 80387)
8086,80286,80386 계열의 CPU는 정수만 다룰 수 있었기 때문에 숫자계산이 느렸다.
Co-Processor(Math Co-Processor) 또는 실수연산처리장치(FPU)가 필요한 것은 이 때문이었다.
보조프로세서는 CPU와 짝을 이뤄 사용
계산을 많이 하는 공학계산, 캐드, 그래픽, 통계 등의 작업에서 주로 사용
주기판에 보조프로세서 자리가 있었음

i80486
1989년 발표 (1991년-486SX)
1,200,000개의 트랜지스터 집적
25 – 100MHz의 속도(25,33,50,66,100)
i80386 + i80387
8KB의 캐시 메모리 내장
RISC의 개념 도입
(한번의 클럭으로 1개의 명령어 처리 가능해짐)

5V, 168pin PGA 형태(80486DX-25)
486DX2, 486DX4(Triple Clocking)로 발전

ODP(Over Drive Processor)
486DX나 486SX를 486DX2로 만들어 주는 기능을 했다.
메인보드에 ODP를 장착할 수 있는 소켓 공간이 있었다.
초기펜티엄 중 P24T 모델도 ODP의 한 종류였다.
ODP를 장착하면 이전의 CPU는 활동을 중지하고 ODP만 작동했다.
486 초기 -> 주기판 100만, CPU 300만

 


Pentium(Pent + Intel + UM)
1993년 발표(P5)
3,100,000개의 트랜지스터
60-300MHz의 클럭 속도(60,66MHz)
내부32/외부64비트 데이터 버스 사용
16KB의 내부 캐시 (각 8KB의 코드/데이터 캐시)
슈퍼스칼라(Super Scalar) - 병렬파이프라인으로 한 클럭에서 여러 개의 명령을 실행할 수 있는 구조를 말한다.
분기예측, Out of Order, 레지스트리 네이밍
5단 파이프라인(Pipe Line) 구조
고성능 FPU 탑재- 486의 4배 속도 향상
273pin PGA 방식
듀얼프로세싱(듀얼CPU) 가능

P54C
1994년 3월
펜티엄 75,90,100,120,133,200MHz
P5의 문제점 해결 위해 기본설계 변경
3.3V 작동 전압
296pin PGA,PPGA, 320pin PGA 등
국내는 95년 하반기부터 출시됨
320-330만개의 트랜지스터

Pentium Pro(P6)
1995.11. 출시
Server, Workstation용
32비트 연산에 최적화 설계 (4way 지원)
550만+(1550만*1,2,4) 개의 트랜지스터
L2 캐시(256KB-1MB)를 CPU에 내장
독자적인 소켓8방식 사용 - 387pin
3개의 파이프라인과 슈퍼스칼라 기술
3.3V, 최대 35-47W 전력소모율

P55C(Pentium MMX)
1997-1999년
32KB 내부 캐시 메모리
입출력 3.3V, 코어 2.8V
450만개의 트랜지스터
57개의 MMX( Multi Media Extension ) 명령어
296pin, 320pin PGA,PPGA,TCP 방식
15-20% 정도의 성능향상
MMX와 실수연산명령을 동시에 사용하지 못함

Pentium II
1997년 봄 출시
P6개선판 + MMX명령어세트
최초의 슬롯방식 CPU(Slot1, Slot2)
750만+개의 트랜지스터
동적실행, 이중독립버스 등의 신기술
P6에 비해 20-30% 정도의 성능 향상
64GB까지의 메인메모리 사용 가능
32KB L1, 512KB L2 Cache
내부 2.8-1.5V, 외부 3.3V(2.5V-Slot2),
233MHz-450MHz 클럭속도, 0.35-0.25㎛공정

펜티엄II 종류
Klamath: 233~300MHz(66MHz FSB)
Deschutes: 266~450MHz(100MHz FSB)
Celeron(Covington) : 266~300MHz
셀러론A(Mendocino) : 300~500MHz
펜티엄II의 FSB속도 : 66MHz와 100MHz
펜티엄II의 L1캐시는 기본적으로 CPU클럭의 ½ 속도로 작동한다.

Pentium III
1999.2. ~ 2002
450MHz ~ 1.0GHz(1.3GHz)
0.25마이크론 공정
950만개의 트랜지스터
MMX + SSE 명령어 세트(70개 명령어 추가)
Katmai
Coppermine
Tualatin

이후...
Pentium 4 - Pentium 4 HT - Core2 Duo -
Core2 Quad(헥사코어-옥타코어) - i Series(3, 5, 7)...

 



 

[Cache Memory]
CPU의 등급과 가격을 구분 짓는 중요한 지표...

클럭 속도와 코어의 수 외에도, CPU의 성능을 가늠할 수 있는 또 하나의 기준은 CPU 안에 들어 있는 캐시 메모리(cache memory)의 용량이다.

‘캐시’라 줄여 부르는데, CPU 내부의 임시 저장공간으로서 CPU가 데이터를 처리할 때 자주 사용하는 데이터를 임시 보관하는 곳이다.
 
이 캐시 메모리의 용량이 작으면 CPU에 비해 동작 속도가 훨씬 느린 주 기억장치(RAM, 메모리)나 보조 기억 장치(하드디스크, CD-ROM 등)로부터 직접 데이터를 불러들이는 빈도가 높아지는데, 이런 경우 컴퓨터의 전반적인 처리 속도가 크게 저하된다.

결론적으로 CPU의 캐시 메모리는 크면 클수록 성능 향상에 유리하다.
 

 L1 캐시(Level 1)

CPU코어 안에내장된 캐시 메모리

명령캐시와 데이터 캐시로 나눔


L2 캐시(Level 2)

L1캐시와 메인메모리 사이의 캐시 메모리

CPU 처리 데이터를 메인 메모리(RAM)에서 미리 가져와
저장 해 놓음,
속도향상 효과


L3 캐시(Level 3)

L2캐시의 완충역할, L2가 빠름, 메인 메모리와의 속도 차 보완



CPU의 성능을 결정하는 요인

  아키텍처 : 제조공정 (TrTr을 연결하는 선의 굵기)

  [Sandy Bridge 32nm, Ivy Bridge 22nm]

 

 

  L2 캐시(Cache) : 용량이 클수록 좋음

  L3 캐시(Cache) : 용량이 클수록 좋음(특정 CPU에만 장착)

  클럭(Clock)속도 : 작동 클럭 속도가 빠를 수록 좋음

  FSB(Front Side Bus) : 시스템버스(FSB)가 빠를 수록 좋음

  [FSB = CPU - North Bridge (or RAM) BUS]

  소켓(Socket) : CPU 핀 수가 많을 수록 좋음

  낮은 전압으로 작동되는 CPU



 

+ 개별 실습과제 H/W CPU 정보검색 +

(스스로 정보검색 문제해결...)

 

1. 나노(nm) 단위의 의미?

2. Intel CPU 각 세대별 구분과 CPU 코드명은?

3. Sandy Bridge ? 세대 / Ivy Bridge ? 세대

4. 현재 가장 최근에 나온 Intel CPU 코드명과 세대는?

 

 



[CPU Over Clocking]

CPU를 정해진 규격의 Clock보다 높은 Clock으로

설정하여 사용하는 것.


모든 CPUOver Clocking이 가능한 것은 아님.

메인보드가 Over Clocking을 지원해야 함.

최근 메인보드는 Auto Over Clocking 기능이 내장.

Intel(Turbo Boost), AMD(Turbo Core) 기술 내장.



클럭(Clock)

컴퓨터 뿐만 아니라 관련 장치들은 모두 주기적인 전자신호로 데이터를
주고 받고 처리한다.


이 전자신호의 빠르기를 일컫는 말로 클럭이라는 표현을 쓰며, 단위는 Hz 를 사용한다.

1Hz 라는 것은 1초에 전자신호의 주기가 1번 바뀌는 것으로, MHz는 1초에 1,000,000번, GHz 라는 것은 1초에 약 1,000,000,000번 움직임을 의미한다.


CPU의 속도를 나타내는 대표적인 단위는 ‘클럭(clock)’인데, 이는 1초당 CPU 내부에서 몇 단계의 작업이 처리되는 지를 측정해 이를 주파수 단위인 ‘Hz(헤르츠)’로 나타낸 것이다.
따라서, 이 클럭 수치가 높을수록 빠른 성능의 CPU라고 할 수 있다. 참고로, 1971년에 등장한 세계 최초의 컴퓨터 CPU인 ‘인텔(Intel) 4004’의 최대 동작 클럭은 740KHz(74만Hz)였으며, 2010년 현재 판매 중인 CPU인 ‘인텔 코어(Core) i7 960’의 동작 클럭은 3.2GHz(32억Hz)에 달한다.


과거에는 이러한 클럭 속도가 CPU의 성능을 나타내는 절대적인 기준이었지만, 최근에는 하나의 CPU에 2개 이상의 코어(Core)를 집어넣은 다중 코어(멀티 코어, Multi Core) CPU가 등장하여, CPU의 성능을 나타내는 또 하나의 기준이 되고 있다.


컴퓨터 CPU에서 코어란 CPU에 내장된 처리회로의 핵심 부분으로서, 예전에는 1개의 CPU 당 1개의 코어(단일 코어: Single Core)만을 가지고 있는 것이 당연했다. 1990년대 후반과 2000년대 초반을 즈음하여, 산업용/전문가용 컴퓨터를 위한 다중 코어 CPU가 출시된 적은 있었으나 특수한 환경에서만 사용되어 컴퓨터 시장에 미치는 영향은 극히 미미했다. 하지만 2005년, 2개의 코어를 갖춘 듀얼 코어(Dual Core) CPU인 인텔의 ‘펜티엄(Pentium) D’와 AMD의 ‘애슬론(Athlon)64 X2’가 등장하면서 다중 코어 CPU가 점차 대중화되기 시작했다.


2007년에는 4개의 코어를 갖춘 쿼드 코어(Quad Core) CPU인 인텔의 ‘코어2 쿼드(Core2 Quad)가 등장했으며, 2008년에는 듀얼 코어와 쿼드 코어 사이의 틈새시장을 노린 코어 3개짜리 트리플 코어(Triple Core) CPU인 AMD의 페넘(Phenom) X3도 출시되어 사용자들의 관심을 받았다. 또한, 2010년에는 코어를 6개나 내장한 헥사 코어(Hexa Core) CPU, 인텔의 ‘코어 i7 980X 익스트림 에디션(Extreme Edition)’도 출시된 바 있다.



Over Clocking 문제점

시스템 불안정, 다운 발생

하드 디스크 손상

CPU의 수명 단축

튜닝 후 발생되는 문제는 무상지원이 불가능

 

 

 

 



시스템 버스 (System Bus Speed)

시스템 버스 는 FSB라는 용어로도 쓰이며 (Front Side Bus) CPU와 메모리 사이에 데이터 이동 속도를 의미한다.
정확하게 말하자면 CPU와 메모리 사이에 있는 메모리 컨트롤러와 CPU, 메모리 사이의 데이터 전송속도를 말한다.

CPU - 메모리 컨트롤러 - 메모리

보통 펜티엄 4 CPU의 경우 FSB가 400MHz ~ 800MHz 까지 있고, 코어2 듀오는 1066MHz 까지 있다.

 

 [IntelCPU의 동작클럭 속도 / L2 Cache / FSB 비교]

 

 

[Intel Celeron CPU]

 


[CPU 온도
]

 

[LGA Intel CPU & Cooler 분해/조립]

posted by [서ㄹ하 雪河 Selha YoonSem]
: