Tesla K40: la nuova scheda per il GPU Computing di NVIDIA

Tesla K40: la nuova scheda per il GPU Computing di NVIDIA

NVIDIA estende la propria gamma di schede video Tesla per il GPU Computing con la proposta Tesla K40, caratterizzata da una dotazione di memoria video di ben 12 Gbytes oltre che dalla GPU GK110 con ben 2.880 CUDA cores attivi

di Paolo Corsini pubblicata il , alle 09:41 nel canale Server e Workstation
NVIDIACUDATesla
 

NVIDIA ha annunciato, in occasione dell'annuale appuntamento con la fiera International Conference for High Performance Computing, Networking, Storage, and Analysis (nota anche con il nome di SC 2013) l'ultima evoluzione di scheda della famiglia Tesla. Si tratta del modello Tesla K40, basato su GPU GK110 in versione con tutti i 2.880 CUDA cores integrati nel chip che sono abilitati e disponibili per l'elaborazione.

Abbiamo già visto all'opera un chip GK110 di questo tipo nel settore desktop, utilizzato sulle schede GeForce GTX 780 Ti presentate nelle scorse settimane. Non solo GeForce: NVIDIA utilizza questa GPU anche per le schede Quadro K6000 destinate alle workstation professionali. La frequenza di clock del chip video è pari a 745 MHz di default, con la possibilità di spingersi sino a 810 MHz oppure a 875 MHz come frequenze di clock boost.

tesla_k40_2.jpg (67072 bytes)

La principale novità di Tesla K40 riguarda però il sottosistema memoria, che vede per la prima volta nella famiglia Tesla una configurazione con 12 Gbytes di memoria video abbinati ad una singola GPU. NVIDIA ha mantenuto l'architettura con bus da 384bit di ampiezza, utilizzando memorie GDDR5 per una frequenza di clock finale effettiva pari a 6 GHz.

La tabella seguente riassume le principali caratteristiche tecniche di questa soluzione a confronto con le altre proposte top di gamma della famiglia Tesla:

CPU

Tesla K40 Tesla K20X Tesla K20 Tesla M2090
architettura Kepler Kepler Kepler Fermi
tipo GPU GK110 GK110 GK110 GF110
CUDA cores 2.880 2.688 2.496 512
base clock GPU 745 MHz 732 MHz 706 MHz 650 MHz
boost clock GPU 810 MHz
875 MHz
- - -
clock memoria 6 GHz 5,2 GHz 5,2 GHz 3,7 GHz
dotazione memoria 12GB 6GB 5GB 6GB
single precision 4,29 TFlops 3,95 TFlops 3,52 TFlops 1,33 TFlops
double precision 1,43 TFlops 1,31 TFlops 1,17 TFlops 655 GFlops
bus memoria 384bit 384bit 320bit 384bit
TDP 235W 235W 225W 250W

Un quantitativo di memoria video pari a 12 Gbytes è stato reso possibile grazie alla disponibilità di moduli memoria GDDR5 da 4 Gbit di densità ciascuno. Tale dotazione si rivela particolarmente utile per quei clienti di NVIDIA che utilizzano applicazioni di elaborazione parallela che sono particolarmente esigenti in termini di memoria a disposizione, e che potrebbero trovare in una dotazione di 6 Gbytes un collo di bottiglia alle prestazioni.

Con Tesla K40 NVIDIA introduce il concetto di GPU boost anche per le proprie schede destinate al calcolo parallelo, ma seguendo un approccio differente rispetto a quanto visto con le soluzioni della famiglia GeForce. La frequenza di clock boost può essere selezionata su due differenti livelli, pari a 810 MHz e 875 MHz, a selezione dell'utente: l'intervento porta ovviamente ad un incremento nel consumo complessivo della scheda, con il rischio che questa vada ad eccedere il TDP con conseguente riduzione automatica della frequenza di clock.

tesla_k40_3.jpg (68972 bytes)

Nel momento in cui si utilizzano differenti schede video Tesla K40 in un cluster la frequenza di clock di ciascuna deve essere mantenuta sullo stesso livello delle altre così da evitare problemi di sincronizzazione; per questo motivo NVIDIA non può offrire una opzione di clock della GPU dinamico con queste schede ma offrire al massimo due opzioni fisse di boost clock, selezionate dall'utente in funzione del carico di lavoro dell'applicazione che andrà ad eseguire così da evitare di superare il limite massimo di TDP della scheda.

In questo modo, se l'applicazione è tale da non creare problemi termici, Tesla K40 permette di ottenere nel confronto con Tesla K20X non solo un notevole incremento della frequenza di clock, sino a 875 MHz con l'impostazione di boost clock più spinta, ma anche di offrire più CUDA cores per l'elaborazione parallela. La conseguenza è un incremento delle prestazioni velocistiche, sostenuto anche dall'aumento nella frequenza di clock della memoria video che passa da 5,2 GHz a 6 GHz effettivi.

La nuova scheda Tesla K40 è disponibile da subito in commercio attraverso i partner OEM di NVIDIA, ad un prezzo che non è stato comunicato ufficialmente ma che è facilmente nell'ordine di almeno 5.000 dollari USA tasse escluse.

1 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
massidifi19 Novembre 2013, 10:10 #1
Un quantitativo di memoria video pari a 12 Gbytes

Ma è corretto chiamarla cosi la memoria di una "scheda" per il calcolo distribuito?

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^