Nvidia presenta Next-Gen Fermi Architecture

GPU Computing with NVIDIA's new Kepler Architecture

Nvidia potrebbe aver ribattezzato il suo NVISION promozionale conferenza alla "GPU Technology Conference", ma è ancora uno show Nvidia in tutto e per tutto. Il CEO Jen-Hsun Huang ha impiegato del tempo durante il suo keynote per presentare la prossima grande architettura della GPU della compagnia, nome in codice "Fermi". Questo è il fan della grafica chip che ha chiamato GT300, il successore generazionale del chip GT200 che alimenta schede come la GeForce GTX 285.

Il gigante dei chip è stato molto attento a posizionare il chip come un nuovo chip grafico, ma un nuovo " Calcola e grafica" chip, in questo ordine (corsivo mio). In effetti, quasi tutto ciò che è stato rivelato sul nuovo chip si riferisce alle sue caratteristiche computazionali, piuttosto che a elementi tradizionalmente orientati alla grafica come unità di trama e finali di rendering. Quello che sappiamo è che il chip è enorme a circa 3,0 miliardi di transistor e sarà prodotto in un processo a 40 nm presso TSMC. Questo è il 40 percento in più di transistor rispetto al chip RV870 nelle nuove schede DirectX 11 della serie Radeon 5800, appena rilasciata dalla rivale AMD. Il chip ha 512 unità di elaborazione (Nvidia li chiama core CUDA) organizzati in 16 "streaming multiprocessor" di 32 core ciascuno. Questo è più del doppio dei 240 core in GT200 e anche i core hanno miglioramenti significativi. Il chip utilizzerà un'interfaccia di memoria GDDR5 a 384 bit.

Ecco alcuni dei principali punti elenco:

Multiprocessore streaming di terza generazione (SM)

32 core CUDA per SM, 4x su GT200
8x le prestazioni di picco in virgola mobile a doppia precisione su GT200
Dual Warp Scheduler che pianifica e invia due distorsioni di 32 thread
per clock
64 KB di RAM con un partizionamento configurabile di memoria condivisa e cache L1

Secondo Generation Parallel Thread Execution ISA

Spazio indirizzo unificato con supporto C ++ completo
Ottimizzato per OpenCL e DirectCompute
Pieno IEEE 754-2008 Precisione a 32 bit e 64 bit
Percorso intero a 32 bit intero con 64 -bit estensioni
Istruzioni per l'accesso alla memoria per supportare la transizione verso l'indirizzamento a 64 bit
Prestazioni migliorate attraverso la predizione

Sottosistema di memoria migliorato

Gerarchia parallela DataCache NVIDIA con cache L1 e L2 unificata
configurabili Prima GPU con supporto per memoria ECC
Funzionamento della memoria atomica notevolmente migliorato prestazioni

NVIDIA GigaThread Engine

Cambio contesto 10 volte più veloce
Esecuzione simultanea del kernel
Esecuzione blocco thread Out of Order
Motori a trasferimento di memoria doppia sovrapposti

Ci sono molte funzionalità aggiuntive che dovrebbero migliorare le prestazioni di questo chip nelle attività di elaborazione del flusso, come velocità di calcolo in virgola mobile a doppia precisione molto più veloce. Le attuali GPU Nvidia calcolano la precisione doppia a una frazione della velocità delle operazioni a precisione singola. Le operazioni in virgola mobile a doppia precisione dovrebbero ora essere a metà delle prestazioni di precisione singola, il che rappresenta un enorme miglioramento. Sono evidenti anche grandi miglioramenti nella memorizzazione nella cache e nella programmazione. Puoi leggere ulteriori informazioni sull'architettura nella nuova pagina di Fermi di Nvidia, che include un white paper in PDF.

Quindi quando sarai in grado di acquistare una scheda grafica che utilizza questo chip? Nvidia non sta dicendo. I rappresentanti dell'azienda hanno affermato che stanno attualmente "portando il chip", il che significa che i campioni di lavoro sono tornati solo di recente dall'impianto di fabbricazione. Prendendo un'ipotesi plausibile dalla storia passata, potremmo dire che dicembre è una data di rilascio ottimistica e che il primo trimestre 2010 per un'ampia disponibilità è più probabile. Aspettatevi che le tavole siano costose. Nvidia non divulgherà le dimensioni del chip, ma a giudicare dal conteggio dei transistor indicheremo tra 450 e 500 mm ² . In aggiunta ai costi aggiuntivi di una scheda di memoria a 384 bit e alle difficoltà di ottenere un buon rendimento da un chip così grande sul relativamente nuovo processo di produzione a 40 nm, si stanno osservando schede che potrebbero essere sia più potenti sia più costoso delle schede Radeon serie 5800 appena rilasciate da AMD.

Segui Jason Cross su Twitter o visita il suo blog

Nvidia presenta Next-Gen Fermi Architecture

GPU Computing with NVIDIA's new Kepler Architecture

Palin Hacking Probe: What Next Next?

Nvidia dice che la sua nuova CPU Fermi eseguirà supercomputer

Nvidia prende in giro Fermi GF100 Mostra al CES 2010

Articoli interessanti

I migliori strumenti di programmazione per insegnare ai bambini

3 Migliori strumenti di scrittura di immagini USB abilitati alla GUI su Linux

10 Migliori Plugin Gutenberg Blocks utili per WordPress

3 Altre alternative VoIP a Skype

Academix GNU/Linux

Strumenti per accedere al file system di Linux da Windows

I migliori strumenti di programmazione per insegnare ai bambini

3 Migliori strumenti di scrittura di immagini USB abilitati alla GUI su Linux

10 Migliori Plugin Gutenberg Blocks utili per WordPress

I migliori strumenti di programmazione per insegnare ai bambini

3 Migliori strumenti di scrittura di immagini USB abilitati alla GUI su Linux

10 Migliori Plugin Gutenberg Blocks utili per WordPress

Nvidia presenta Next-Gen Fermi Architecture

GPU Computing with NVIDIA's new Kepler Architecture

Consigliato

Articoli interessanti