lunedì 25 gennaio 2010

Storia del Microprocessore parte 2

..... continua da "Storia del microprocessore"

P.S.:  Mi raccomando, leggete la storia di Federico Faggin l’ingegnere veneto che per primo al mondo creò il microprocessore Intel 4004 (prima Cpu della storia ) dirigendo un’equipe di tecnici nei laboratori di ricerca americani di Intel…...un onore e vero orgoglio non da poco per noi Italiani!





L'architettura dell'Athlon

L' Athlon include 3 decoders per istruzione x86. Questi decoders traducono le istruzioni x86 in macro operations (MacroOPs) a lunghezza fissa per un più alto rendimento nell'esecuzione dell'elaborazione. Invece di eseguire direttamente le istruzioni x86 che hanno lunghezza da 1 a 15 bytes, l'Athlon esegue le MacroOPs RISC-Like migliorando di molto le prestazioni delle altre unità di elaborazione ed ottimizzazione.





Una volta che le MacroOPs sono decodificate, fino a 3 MacroOPs sono inviate all' ICU, per ogni ciclo di clock. L'ICU è un Buffer Reorder per MacroOPs a 72 entry che gestisce lo smistamento delle istruzioni, esegue la rinominazione del registro per gli operandi, e gestisce tutti gli stati d'eccezione e le operazioni di ritiro. L' ICU invia le MacroOPs agli Schedulers delle numerose unità di esecuzione multiple presenti nel K7.

L' Athlon contiene uno scheduler a 18 entry per le istruzioni sui numeri interi e uno scheduler a 36 entry per l'FPU/3DNow. Questi schedulers distribuiscono le MacroOPs alle nove pipeline di esecuzione indipendenti:
3 per i calcoli sugli interi
3 per il calcolo degli indirizzi
3 per l'esecuzione delle Mmx, 3dnow! e istruzioni floating point x87

L' Athlon offre il più potente e avanzato motore di floating point per piattaforma x86. L'FPU dell' Athlon è basata su 3 unità di esecuzione completamente pipelined (contro le due unità del PIII). Queste 3 unità di esecuzione (FMUL, FAD e FSTORE) eseguono tutte le istruzioni x87, Mmx, Enhaced 3dnow.

I primi Athlon furono costruiti con tecnologia a 0.25 micron e interconnessioni in Alluminio ed erano posti in una cartuccia tipo Pentium II e inseriti in uno slot chiamato Slot A, simile concettualmente allo Slot I di Intel. Nella cartuccia era presente una L2 cache di 512KB funzionante tipicamente ad 1/2 o 1/3 della frequenza del core.

Qui di seguito trovate lo schema esplicativo del core di tutta la famiglia K7:



AMD K7 - Thunderbird e Palomino

Come Intel, anche AMD passò più tardi (seconda metà 2000) all'integrazione di una cache di secondo livello direttamente sul die del processore. Con il passaggio alla tecnologia 0.18 micron con interconnessioni in Rame (core Thunderbird), AMD è riuscita a portare un consistente aumento delle frequenze e una sensibile diminuzione del calore prodotto oltre alla su menzionata integrazione di una L2 cache, da 256KByte per il modello Athlon e da 64KByte per il Duron, operante a piena velocità. Il passaggio coincidette anche con l'abbandono dello SlotA in favore del più economico e pratico SocketA.





Il resto è storia dei nostri giorni: Il P-III ha perso la sfida con il Thunderbird sia sotto il profilo delle frequenza (il PIII si è dovuto fermare a 1.1GHz per limiti tecnologici) che sotto quello della potenza specifica e del costo. Certamente AMD ha saputo sfruttare bene il grave momento di stallo che Intel vissuto dai tempi dell fallimentare PIII 1.13GHz fino a poco tempo fa, giocando molto sulla leva prezzo per abbracciare sempre più ampie fette di mercato ai danni dell'avversario. Alla stabilizzazione della piattaforma Pentium 4 da parte di Intel, AMD risponde con una ulteriore ottimizzazione della collaudata ed efficientissima architettura K7: l'Athlon XP. Poche le innovazioni del core Palomino ma sufficienti a guadagnare un incremento di prestazioni dell'ordine del 10-20% rispetto alle soluzioni precedenti e a consolidare la quota di mercato di AMD che pare sia ritornata su un valore del 30%. Con L'Athlon XP AMD reintroduce anche il vecchip P-Rating come risposta alle elevate frequenze del Pentium4 non rappresentative della potenza sviluppata in relazione ai prodotti AMD.

Come preannunciato, AMD non ha introdotto grosse modifiche al suo nuovo core (in particolare le unità di elaborazione principali e le cache rimangono identiche a quelle precedenti) ma ne ha ottimizzato alcuni aspetti per poter ottenere minori consumi, maggiori velocità di clock e maggiore potenza utilizzando lo stesso numero di transistor (37,5 Milioni contro i precedenti 37 Milioni del Thunderbird). Andiamo ad analizzare queste nuove caratteristiche:


- Incremento delle L1 TLB Entries:
Si tratta di una piccola cache interna al processore che viene utilizzata per accelerare il processo di traslazione degli indirizzi da logici a fisici ( Traslation Loookaside Buffer ). L'incremento del buffer porta a una maggiore uniformità delle prestazioni in condizioni di Multi-Tasking e nei Server (modello Athlon MP).


- Introduzione del Data Prefetch:
Si tratta di un meccanismo di previsione dei dati che verranno utilizzati dal flusso di istruzioni in esecuzione; la predizione permette di caricare in cache anticipatamente i dati necessari aumentando il rendimento nell'accesso alla memoria esterna. I maggiori benefici si hanno in architetture ad elevata banda e alta latenza quindi quelle tipiche del Pentium 4 (che infatti ha un suo meccanismo avanzato di pre-fetch) e dell'Athlon con memoria DDR. La vera novità è comunque rappresentata dalla possibilità di controllare via software il Prefetch.


- Compatibilità con le SSE: 
AMD ha introdotto nel set 3DNow 52 nuove istruzioni che rendono di fatto l'Athlon completamente compatibile con la tecnologia SSE di Intel. Ai puristi questo può sembrare un controsenso ma permetterà agli sviluppatori di uniformare lo sviluppo del codice sia per Athlon che per Pentium. L'implementazione del set di istruzioni SSE2 (presenti nel P4) sarà appannaggio della futura architettura x86-64 di AMD.





- Tecnologia PowerNow!:
La tecnologia di riduzione del consumo permette all'Athlon un utilizzo proficuo nel settore Mobile (modello Athlon 4). PowerNow! consente di variare tensione e frequenza del core in funzione dell'impiego del processore. Sono previsti fino a 32 step a partire da 500MHz - 1.2V fino alla frequenza massima del processore. La tensione del core alla frequenza nominale si è molto ridotta passando dagli 1.7V a 1.4V (per frequenze intorno al GHz). AMD ha pensato bene di inserire anche un diodo di relavamento termico (analogamente al PIII e PIV) per garantire una maggiore protezione del core da eventuali stress termici. La riduzione dei consumi è al minimo del 20% (grazie alla tensione del core), mentre la tecnologia PowerNow! permette di estendere l'autonomia delle batterie di un portatile di fascia media fino a 3 - 3,5 ore.


Per adesso il nostro viaggio nel passato e nel presente dei processori x86 finisce qui, in futuro aggiungeremo a questa risorsa le caratteristiche dei futuri processori AMD ed Intel in particolare di tutti quei fantastici processori multi-core con le quali architetture gli ingegneri di Intel e Amd non ci dormono la notte (e forse nemmeno io talmente ne sono appassionato).

Quad-core...Extreme-edition..Quad-pumped...Core 2 Duo..e così via .

Un’inarrestabile corsa alla potenza estrema per la conquista della leadership più ambita:
La Cpu più potente al mondo…  (del momento..s’intende!)



Fine articolo


Bookmark and Share



Nessun commento: