Siti web

Nvidia presenta Next-Gen Fermi Architecture

GPU Computing with NVIDIA's new Kepler Architecture

GPU Computing with NVIDIA's new Kepler Architecture
Anonim

Nvidia potrebbe aver ribattezzato il suo NVISION promozionale conferenza alla "GPU Technology Conference", ma è ancora uno show Nvidia in tutto e per tutto. Il CEO Jen-Hsun Huang ha impiegato del tempo durante il suo keynote per presentare la prossima grande architettura della GPU della compagnia, nome in codice "Fermi". Questo è il fan della grafica chip che ha chiamato GT300, il successore generazionale del chip GT200 che alimenta schede come la GeForce GTX 285.

Il gigante dei chip è stato molto attento a posizionare il chip come un nuovo chip grafico, ma un nuovo " Calcola e grafica" chip, in questo ordine (corsivo mio). In effetti, quasi tutto ciò che è stato rivelato sul nuovo chip si riferisce alle sue caratteristiche computazionali, piuttosto che a elementi tradizionalmente orientati alla grafica come unità di trama e finali di rendering. Quello che sappiamo è che il chip è enorme a circa 3,0 miliardi di transistor e sarà prodotto in un processo a 40 nm presso TSMC. Questo è il 40 percento in più di transistor rispetto al chip RV870 nelle nuove schede DirectX 11 della serie Radeon 5800, appena rilasciata dalla rivale AMD. Il chip ha 512 unità di elaborazione (Nvidia li chiama core CUDA) organizzati in 16 "streaming multiprocessor" di 32 core ciascuno. Questo è più del doppio dei 240 core in GT200 e anche i core hanno miglioramenti significativi. Il chip utilizzerà un'interfaccia di memoria GDDR5 a 384 bit.

Ecco alcuni dei principali punti elenco:

Multiprocessore streaming di terza generazione (SM)

  • 32 core CUDA per SM, 4x su GT200
  • 8x le prestazioni di picco in virgola mobile a doppia precisione su GT200
  • Dual Warp Scheduler che pianifica e invia due distorsioni di 32 thread
  • per clock
  • 64 KB di RAM con un partizionamento configurabile di memoria condivisa e cache L1

Secondo Generation Parallel Thread Execution ISA

  • Spazio indirizzo unificato con supporto C ++ completo
  • Ottimizzato per OpenCL e DirectCompute
  • Pieno IEEE 754-2008 Precisione a 32 bit e 64 bit
  • Percorso intero a 32 bit intero con 64 -bit estensioni
  • Istruzioni per l'accesso alla memoria per supportare la transizione verso l'indirizzamento a 64 bit
  • Prestazioni migliorate attraverso la predizione

Sottosistema di memoria migliorato

  • Gerarchia parallela DataCache NVIDIA con cache L1 e L2 unificata
  • configurabili Prima GPU con supporto per memoria ECC
  • Funzionamento della memoria atomica notevolmente migliorato prestazioni

NVIDIA GigaThread Engine

  • Cambio contesto 10 volte più veloce
  • Esecuzione simultanea del kernel
  • Esecuzione blocco thread Out of Order
  • Motori a trasferimento di memoria doppia sovrapposti

Ci sono molte funzionalità aggiuntive che dovrebbero migliorare le prestazioni di questo chip nelle attività di elaborazione del flusso, come velocità di calcolo in virgola mobile a doppia precisione molto più veloce. Le attuali GPU Nvidia calcolano la precisione doppia a una frazione della velocità delle operazioni a precisione singola. Le operazioni in virgola mobile a doppia precisione dovrebbero ora essere a metà delle prestazioni di precisione singola, il che rappresenta un enorme miglioramento. Sono evidenti anche grandi miglioramenti nella memorizzazione nella cache e nella programmazione. Puoi leggere ulteriori informazioni sull'architettura nella nuova pagina di Fermi di Nvidia, che include un white paper in PDF.

Quindi quando sarai in grado di acquistare una scheda grafica che utilizza questo chip? Nvidia non sta dicendo. I rappresentanti dell'azienda hanno affermato che stanno attualmente "portando il chip", il che significa che i campioni di lavoro sono tornati solo di recente dall'impianto di fabbricazione. Prendendo un'ipotesi plausibile dalla storia passata, potremmo dire che dicembre è una data di rilascio ottimistica e che il primo trimestre 2010 per un'ampia disponibilità è più probabile. Aspettatevi che le tavole siano costose. Nvidia non divulgherà le dimensioni del chip, ma a giudicare dal conteggio dei transistor indicheremo tra 450 e 500 mm 2 . In aggiunta ai costi aggiuntivi di una scheda di memoria a 384 bit e alle difficoltà di ottenere un buon rendimento da un chip così grande sul relativamente nuovo processo di produzione a 40 nm, si stanno osservando schede che potrebbero essere sia più potenti sia più costoso delle schede Radeon serie 5800 appena rilasciate da AMD.

Segui Jason Cross su Twitter o visita il suo blog