Tesla K20X e K20: le schede NVIDIA con GPU GK110

Tesla K20X e K20: le schede NVIDIA con GPU GK110

K20X e K20: questi i nomi scelti per identificare le due nuove schede video NVIDIA della famiglia Tesla destinate agli ambiti di GPU Computing. Nuova GPU GK110 alla base di queste soluzioni, con una potenza di elaborazione in double precision che è nettamente più elevata di quanto disponibile con le schede Fermi oltre che con quelle Tesla K10 in commercio

di Paolo Corsini pubblicato il nel canale Server e Workstation
NVIDIATesla
 

La GPU GK110

Quali sono le principali caratteristiche tecniche di GK110? Questo chip video integra al proprio interno un totale di 15 SMX, ciascuno dotato di 192 CUDA cores per un totale di 2.880 cores. In K20X l'implementazione scelta prevede 14 SMX abilitati per un totale di 2.688 CUDA cores; in K20 passiamo a 13 SMX per 2.496 CUDA cores. La scelta di non utilizzare tutti gli SMX a disposizione della GPU permette di ottenere superiori rese produttive: alcuni chip possono infatti presentare uno o più dei moduli SMX difettosi e disabilitandoli si ottiene una GPU ancora adatta all'utilizzo, cosa non accessibile nel momento in cui dovesse venir utilizzata una implementazione con tutti i 15 SMX abilitati.

tesla_k20x_scheda.jpg (74161 bytes)

L'elevata potenza di elaborazione in double precision di GK110 è derivata dalla presenza di ben 64 unità di calcolo di tipo FP64 in ogni SMX, contro ile sole 8 integrate nella GPU GK104 adottata nelle schede Tesla K10. Per questo motivo il picco di potenza di calcolo in double precision è pari a 1/3 di quello in single precision con le soluzioni della famiglia K20, contro un rapporto di 1/24 per le soluzioni GK104.

gk110_schema_1.jpg (32015 bytes)

Nel confronto tra GK104 e GK110 segnaliamo la presenza di alcune tecnologie specifiche che migliorano l'efficienza della GPU in ambito di calcolo parallelo. La prima prende il nome di Hyper-Q ed indica la capacità della GPU di gestire task simultanei in Kepler, sino ad un massimo di 32, contro il singolo task che poteva essere eseguito con le soluzioni della famiglia Fermi. Questo approccio tende a massimizzare il tasso di occupazione della GPU, facendo in modo che tutte le unità di elaborazione siano nei limiti del possibile utilizzate.

gk110_schema_2.jpg (35866 bytes)

Dynamic Parallelism indica invece la capacità del chip GK110 di fare in modo che un kernel possa inviare a sua volta un kernel, mentre in Fermi tale opzione era limitata richiedendo un intervento diretto della CPU. Operando in questo modo GK110 permette di liberare la CPU da alcune delle operazioni, riducendo parallelamente la latenza delle operazioni.

Con l'annuncio odierno la gamma di schede NVIDIA Tesla si completa. Per gli utenti che ricercano le massime prestazioni velocistiche in single precision Tesla K10, forte di due GPU GK104, risulta essere preferibile come picco di potenza assoluta. Per gli ambiti dove le elaborazioni in double precision assumono maggiore importanza le schede Tesla K20X e K20 sono di gran lunga da preferire; queste ultime risultano più indicate in specifici ambiti, potendo vantare alcune peculiarità rispetto alle proposte K10 come ad esempio l'avere correzione ECC non solo per la memoria video ma anche per tutte le tipologie di memoria integrate all'interno della GPU. Il prezzo della scheda Tesla K20 è stato indicato in precedenza da NVIDIA: 3.199 dollari, tasse escluse; per la versione Tesla K20X mancano indicazioni ma pare possibile che superi i 4.000 dollari per scheda. Alla luce delle specifiche tecniche ufficiali emerge che le soluzioni Tesla inserite all'interno del supercomputer Titan siano proprio modelli Tesla K20X e non Tesla K20 come inizialmente indicato.

Con l'annuncio di questa mattina della scheda AMD FirePro S10000 e delle due nuove proposte Tesla K20X e K20 di NVIDIA il mercato delle GPU per elaborazioni professionali di calcolo parallelo diventa sempre più interessante. Accanto a questi modelli dobbiamo anche inserire le schede Xeon Phi di Intel, soluzioni che potrebbero diventare progressivamente popolari in questo segmento del mercato che non sembra conoscere sosta.

  • Articoli Correlati
  • AMD FirePro S10000: la prima scheda con due GPU AMD FirePro S10000: la prima scheda con due GPU La prima novità dal SC12 di Salt Lake City viene da AMD con la scheda FirePpro S10000, prima soluzione per ambito professionale del produttore americano ad integrare due GPU in parallelo. Potenza di calcolo ai vertici in single e double precision, in attesa delle proposte K20 di NVIDIA
10 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
Hellraiser8312 Novembre 2012, 15:21 #1
post errato
polkaris12 Novembre 2012, 16:21 #2
Interessante...ma...Una domanda da profano: per l'utente povero vale veramente la pena spendere tutti sti soldi quando si può fare calcolo parallelo con GPU che costano un decimo di queste? Vedo che il numero di cores non scala linearmente con il prezzo....
unfaced1212 Novembre 2012, 16:34 #3
Originariamente inviato da: polkaris
Interessante...ma...Una domanda da profano: per l'utente povero vale veramente la pena spendere tutti sti soldi quando si può fare calcolo parallelo con GPU che costano un decimo di queste? Vedo che il numero di cores non scala linearmente con il prezzo....


La grande differenza sta nei driver appositi per queste schede, poi un utente povero non ha bisogno di roba del genere.... queste sono GPU che servono ad aziende che il termine povero nemmeno lo conoscono.
Cmq mi sembra di capire che tutte le speranze dei fan verdi su GK110 per il mercato delle GeForce siano crollate.... queso chip è inteso per l'uso PRO e basta. Tanta roba superflua per i giochi che andrebbe solo a scaldare-consumare senza dare reali benefici.
polkaris12 Novembre 2012, 16:39 #4
Beh, in realtà le GPU per il calcolo servono anche all'università, ai centri di ricerca o al semplice appassionato. Tutte entità che devono fare i conti con il proprio "portafoglio"....
Tedturb012 Novembre 2012, 17:20 #5
comunque tanto di cappello a nvidia questa volta. a parita di consumi va nettamente di piu di tahiti
marchigiano12 Novembre 2012, 18:57 #6
quindi meglio differenziare le gpu da gioco e da calcolo?

notato l'hyper threading da 32 threads a core?
tuttodigitale12 Novembre 2012, 19:37 #7
Originariamente inviato da: Tedturb0
comunque tanto di cappello a nvidia questa volta. a parita di consumi va nettamente di piu di tahiti
solo in gaming, Tahiti è molto più orientato al GPGPU che al gaming, come è intuibile dalle capacità di calcolo in doppia precisione. A ben vedere AMD è avanti: le schede con le migliori prestazioni per watt sono basate su GCN (fonte Techpowerup) e offrono prestazioni nel calcolo straordinarie (le nvidia gtx680 sono mediamente peggiori delle gtx570-580)
Vedendo le slide nvidia è ipotizzabile che Tahiti si posizioni nel GPGPU addirittura a livelli diGK110, sarà interessante verificare se nvidia ha mantenuto il vantaggio su AMD a livello di prestazioni...ho i miei dubbi. Già un -10% con GK110 sarebbe uno shock per la casa verde.

PS il paper launch di tahiti è avvenuto a Dicembre...Ed è possibile che la diversa organizzazione interna di Pit-Cairn e Cape-Verde, sfrutti meglio la potenza degli stream processor...hai notato che nonostante la grande differenza nei numeri di stream processor tra una HD7870 e una HD7970, le prestazioni non sono più elevate del 60% nonostante la seconda abbia una bandwidth verso le memorie e una potenza bruta che sulla carta permettono questo salto prestazionale.
Imho, le ROPs (32 come Pit cairn che però ha solo 1280 sp vs 2048) fanno da collo di bottiglia, come lo facevano nelle HD5830.
Una distribuzione simile a Pit-Cairn e stai sicuro che anche il top di gamma offrirà prestazioni per watt straordinarie (in gaming, nel gpgpu già lo sono, anzi con queste modifiche è destinato a calare)

X la redazione
Perchè avete questa mania di duplicare il bandwidth... 2 bus da 240GB/s non sempre garantiscono 480GB/s di dati. Devo credere che i due bus siano di tipo "esclusivo"?
AceGranger13 Novembre 2012, 11:49 #8
Originariamente inviato da: tuttodigitale
solo in gaming, Tahiti è molto più orientato al GPGPU che al gaming, come è intuibile dalle capacità di calcolo in doppia precisione.


guarda che il PGPGU non è solo DP...

Originariamente inviato da: tuttodigitale
A ben vedere AMD è avanti: le schede con le migliori prestazioni per watt sono basate su GCN (fonte Techpowerup) e offrono prestazioni nel calcolo straordinarie (le nvidia gtx680 sono mediamente peggiori delle gtx570-580)
Vedendo le slide nvidia è ipotizzabile che Tahiti si posizioni nel GPGPU addirittura a livelli diGK110, sarà interessante verificare se nvidia ha mantenuto il vantaggio su AMD a livello di prestazioni...ho i miei dubbi. Già un -10% con GK110 sarebbe uno shock per la casa verde.


mi pare che le schede con le migliori prestazioni per Watt saranno i GK110, e nel DP il vantaggio è schiacciante.
tuttodigitale13 Novembre 2012, 23:23 #9
Originariamente inviato da: AceGranger
guarda che il PGPGU non è solo DP...

infatti le gpu Pit-Cairn sono più GP oriented di quando non lo sia GK104.
Il gk104 va mediamente il 30% meno di un GF100(certo facendo i salti mortali con il software si può sfruttare maggiormente la potenza messa a disposizione dalle ALU, ma questo valeva anche per il vliw di AMD) ...non so se rendo l'idea di quanto nvidia ha menomato le prestazioni GP della fascia media.
http://www.tomshw.it/cont/articolo/...e/38217/14.html
vero che non c'è pit-cairn, ma questo è il 60% di una HD7970 GHz edition...ergo è di gran lunga superiore a gk104, nonostante sia più piccolo e parsimonioso di corrente.
Tanto per ribadire che l'incarnazione desktop di kepler va bene per i giochi (ma non stupisce più, visto quanto sono salite le prestazioni di GCN nei giochi dove nvidia regnava nel recente passato), ma nvidia per gk104 ha sacrificato le prestazioni nel GPGPU anche a precisione singola.
tuttodigitale13 Novembre 2012, 23:27 #10
Originariamente inviato da: AceGranger
mi pare che le schede con le migliori prestazioni per Watt saranno i GK110, e nel DP il vantaggio è schiacciante.

sono solo slide, anche Bulldozer era il processore più veloce al mondo.
Comunque mi riferivo al gaming. GCN nelle sue incarnazioni successive, pit-cairn e Cape Verde, hanno visto una serie di modifiche, che hanno fatto si che le prestazioni per watt fossero le più elevate fra tutte le gpu in commercio senza intaccare le prestazioni nel GPU SP
PS con 10% intendevo al netto della differenza di die size..

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^