GPU Computing with NVIDIA's new Kepler Architecture
Il gigante dei chip è stato molto attento a posizionare il chip come un nuovo chip grafico, ma un nuovo " Calcola e grafica" chip, in questo ordine (corsivo mio). In effetti, quasi tutto ciò che è stato rivelato sul nuovo chip si riferisce alle sue caratteristiche computazionali, piuttosto che a elementi tradizionalmente orientati alla grafica come unità di trama e finali di rendering. Quello che sappiamo è che il chip è enorme a circa 3,0 miliardi di transistor e sarà prodotto in un processo a 40 nm presso TSMC. Questo è il 40 percento in più di transistor rispetto al chip RV870 nelle nuove schede DirectX 11 della serie Radeon 5800, appena rilasciata dalla rivale AMD. Il chip ha 512 unità di elaborazione (Nvidia li chiama core CUDA) organizzati in 16 "streaming multiprocessor" di 32 core ciascuno. Questo è più del doppio dei 240 core in GT200 e anche i core hanno miglioramenti significativi. Il chip utilizzerà un'interfaccia di memoria GDDR5 a 384 bit.
Ecco alcuni dei principali punti elenco:
Multiprocessore streaming di terza generazione (SM)
- 32 core CUDA per SM, 4x su GT200
- 8x le prestazioni di picco in virgola mobile a doppia precisione su GT200
- Dual Warp Scheduler che pianifica e invia due distorsioni di 32 thread
- per clock
- 64 KB di RAM con un partizionamento configurabile di memoria condivisa e cache L1
Secondo Generation Parallel Thread Execution ISA
- Spazio indirizzo unificato con supporto C ++ completo
- Ottimizzato per OpenCL e DirectCompute
- Pieno IEEE 754-2008 Precisione a 32 bit e 64 bit
- Percorso intero a 32 bit intero con 64 -bit estensioni
- Istruzioni per l'accesso alla memoria per supportare la transizione verso l'indirizzamento a 64 bit
- Prestazioni migliorate attraverso la predizione
Sottosistema di memoria migliorato
- Gerarchia parallela DataCache NVIDIA con cache L1 e L2 unificata
- configurabili Prima GPU con supporto per memoria ECC
- Funzionamento della memoria atomica notevolmente migliorato prestazioni
NVIDIA GigaThread Engine
- Cambio contesto 10 volte più veloce
- Esecuzione simultanea del kernel
- Esecuzione blocco thread Out of Order
- Motori a trasferimento di memoria doppia sovrapposti
Ci sono molte funzionalità aggiuntive che dovrebbero migliorare le prestazioni di questo chip nelle attività di elaborazione del flusso, come velocità di calcolo in virgola mobile a doppia precisione molto più veloce. Le attuali GPU Nvidia calcolano la precisione doppia a una frazione della velocità delle operazioni a precisione singola. Le operazioni in virgola mobile a doppia precisione dovrebbero ora essere a metà delle prestazioni di precisione singola, il che rappresenta un enorme miglioramento. Sono evidenti anche grandi miglioramenti nella memorizzazione nella cache e nella programmazione. Puoi leggere ulteriori informazioni sull'architettura nella nuova pagina di Fermi di Nvidia, che include un white paper in PDF.
Quindi quando sarai in grado di acquistare una scheda grafica che utilizza questo chip? Nvidia non sta dicendo. I rappresentanti dell'azienda hanno affermato che stanno attualmente "portando il chip", il che significa che i campioni di lavoro sono tornati solo di recente dall'impianto di fabbricazione. Prendendo un'ipotesi plausibile dalla storia passata, potremmo dire che dicembre è una data di rilascio ottimistica e che il primo trimestre 2010 per un'ampia disponibilità è più probabile. Aspettatevi che le tavole siano costose. Nvidia non divulgherà le dimensioni del chip, ma a giudicare dal conteggio dei transistor indicheremo tra 450 e 500 mm 2 . In aggiunta ai costi aggiuntivi di una scheda di memoria a 384 bit e alle difficoltà di ottenere un buon rendimento da un chip così grande sul relativamente nuovo processo di produzione a 40 nm, si stanno osservando schede che potrebbero essere sia più potenti sia più costoso delle schede Radeon serie 5800 appena rilasciate da AMD.Segui Jason Cross su Twitter o visita il suo blog
Palin Hacking Probe: What Next Next?
L'indagine sull'hacking della posta elettronica di Sarah Palin è lungi dall'essere conclusa. Ecco dove stanno le cose, e dove vanno da qui.
Nvidia dice che la sua nuova CPU Fermi eseguirà supercomputer
Nvidia ha mostrato una scheda grafica basata sulla sua nuova architettura Fermi, che accelera le prestazioni di le sue future GPU.
Nvidia prende in giro Fermi GF100 Mostra al CES 2010
Nvidia suona nel nuovo anno con notizie di campioni Fermi GF100 al CES 2010 della prossima settimana a Las Vegas.