AMD Radeon Instinct: le schede per intelligenza artificiale

AMD Radeon Instinct: le schede per intelligenza artificiale

AMD annuncia una nuova famiglia di prodotti specificamente destinata al datacenter, assieme all'ecosistema software abbinato. Radeon Instinct, questo il nome, comprende attualmente 3 schede e vede anche la prima soluzione basata su architettura Vega di nuova generazione. Debutto nel corso della prima metà del 2017.

di Paolo Corsini pubblicato il nel canale Server e Workstation
SupermicroVegaRadeon InstinctRadeonAMDZen
 

L'utilizzo delle GPU per applicazioni che non sono quelle tradizionali della grafica 3D è un fenomeno ben noto tanto agli appassionati come a chi è impegnato nel settore del calcolo parallelo. Nel confronto con le tradizionali architetture di CPU le GPU si sono dimostrate essere unità di elaborazione molto specifiche, in grado di assicurare un netto incremento delle prestazioni velocistiche per quegli scenari di utilizzo che sfruttano al meglio l'elevato parallelismo proprio delle GPU. Molte delle funzionalità implementate tanto da NVIDIA come da AMD nelle proprie più recenti architetture GPU puntano proprio nella direzione di fornire superiori prestazioni in ambito di elaborazione parallela non grafica.

slide_10.jpg (47357 bytes)

Negli ultimi anni è inoltre emerso con grande enfasi il tema del cosiddetto machine learning, cioè quel filone del supercalcolo che vede i sistemi di elaborazione impegnati ad analizzare una mole elevatissima di dati e da questi derivare comportamenti pratici. Un esempio popolare nel mondo consumer è il lavoro legato alla guida autonoma, nel quale dispositivi di calcolo integrati nelle automobili apprendono costantemente come potersi muovere nel traffico automobilistico così che l'autista possa diventare un passeggero a tutti gli effetti. La mole di calcoli e di informazioni che questo tipo di approccio richiede è elevatissima, e da questo deriva l'utilizzo delle GPU quale acceleratore che permetta di andare oltre i limiti propri delle tradizionali CPU in questo tipo di compiti.

slide_2.jpg (67717 bytes)

L'intelligenza artificiale è tema che spinge in modo netto verso l'evoluzione tecnologica e richiede sistemi di calcolo sempre più complessi. Per questo motivo AMD annuncia quest'oggi l'iniziativa Radeon Instinct, con la quale vuole offrire un proprio approccio completo legato all'intelligenza artificiale nel complesso. Il primo blocco di questa struttura è ovviamente legato alle soluzioni hardware: AMD annuncia 3 nuove schede di questa famiglia, caratterizzate da una costruzione particolare adatta per l'utilizzo in datacenter e basate su 3 GPU AMD molto particolari.

slide_1.jpg (43431 bytes)

Radeon Instinct MI6 è la prima scheda della famiglia, modello per il quale l'azienda dichiara una capacità di elaborazione di 5,7 TFLOPs di picco a FP16 con bandwidth della memoria video di 224 GB/s e un TDP pari a meno di 150 Watt. Queste specifiche tecniche lasciano immediatamente capire come sotto la scocca vi sia una GPU Polaris 10, cioè lo stesso modello utilizzato nelle schede Radeon RX 470 e Radeon RX 480 in abbinamento a memoria video GDDR5 con clock effettivo di 7 GHz. AMD non lo specifica ma è probabile che questa scheda sia dotata di 8 Gbytes di memoria video, anche se non è da escludere che tale quantitativo possa essere pari a 16 Gbytes.

La seconda scheda è Radeon Instinct MI8, modello di tipo small form factor molto compatta: per questa scheda la potenza dichiarata è pari a 8,2 TFLOPs di picco a FP16, con memoria video capace di 512 Gbytes al secondo di bandwidth e un TDP dichiarato entro 175 Watt. Facile ritrovare in queste specifiche tecniche la scheda Radeon R9 Nano, modello basato su GPU Fury in abbinamento a memoria HBM in quantitativo di 4 Gbytes.

raja_mi25_card.jpg (129173 bytes)
Raja Koduri, CTO di AMD per il Radeon Technologies Group, mostra un prototipo di scheda Radeon Instinct MI25

La terza scheda è probabilmente la più interessante: si tratta della soluzione Radeon Instinct MI25 Vega with NCU, così la identifica AMD nel proprio materiale di presentazione, ed è questa la prima scheda basata su GPU Vega che viene ufficialmente annunciata da AMD. Le specifiche tecniche indicate sono poche: la scheda è raffreddata passivamente e viene indicato un TDP inferiore a 300 Watt; è presente una memoria cache di tipo High Bandwidth assieme ad un controller specifico, mentre dal versante prestazionale è riportato un raddoppio delle prestazioni nell'elaborazione di packed math anche se manca un riferimento diretto a quale sia la scheda con la quale questa proposta viene confrontata.

Queste schede verranno costruite unicamente da AMD, senza quindi il coinvolgimento diretto dei partner: si tratta di una scelta quasi naturale considerando la complessità dei prodotti e il target di riferimento. Al momento attuale l'azienda americana non ha divulgato i prezzi di questi 3 nuovi acceleratori della famiglia Radeon Instinct, segnalando che il debutto sul mercato avverrà nel corso della prima metà del 2017.

slide_9.jpg (51075 bytes)

La componente hardware è solo uno degli elementi che compongono l'iniziativa Radeon Instinct: MIOpen è il nome con il quale viene indicata la libreria open source per il deep learning abbinata alle soluzioni hardware Radeon Instinct proposta da AMD, soluzione che alla luce dei dati preliminari forniti da AMD permette di ottenere un livello prestazionale molto elevato nel complesso anche nel confronto con le soluzioni concorrenti basate su GPU NVIDIA. AMD prevede di rendere disponibile questa libreria nel corso del primo trimestre 2017, offrendo accelerazione delle elaborazioni via GPU con routine standard come quelle di convultion, pooling, activation functions, normalization e tensor format.

slide_8.jpg (51359 bytes)

Più in generale quello che AMD propone con la piattaforma Radeon Open Compute è una soluzione che sfrutta le peculiarità hardware delle schede della famiglia Radeon Instinct abbinandovi i componenti richiesti dalle differenti applicazioni legate all'intelligenza artificiale. AMD ha chiaramente indicato come quello che vuole sviluppare sia un ecosistema open, nel quale possano venir utilizzati frameworks, middleware e librerie che sono già adottate dagli sviluppatori: emerge in modo chiaro la contrapposizione con l'ecosistema proprietario sviluppato da NVIDIA, che nelle intenzioni di AMD non rappresenta la strategia da seguire.

slide_6.jpg (67138 bytes)

AMD ha già annunciato partnership con vari produttori di sistemi di supercalcolo per integrare soluzioni Radeon Instinct all'interno di proprie soluzioni. Un primo esempio è il sistema SuperMicro SYS 1028GQ-TRT, dotato al proprio interno di 3 acceleratori MI25 in abbinamento a due processori x86 che massimizza la potenza di elaborazione sfruttando uno chassis rack a 1 unità.

slide_5.jpg (80054 bytes)

Il sistema K888 integra 4 schede Radeon Instinct MI25 ed è indicato essere capace di raggiungere una potenza di elaborazione di 100 TeraFLOPs con elaborazioni FP16: da questo dato, oltre che dallo studio dei nomi scelti da AMD per identificare queste schede, ne deriva la potenza di elaborazione di una singola scheda MI25 con GPU Vega che è pari a 25 TFLOPs con calcoli FP16.

slide_4.jpg (107636 bytes)

Aumentano le dimensioni con il sistema Falconwitch: grazie all'integrazione di 16 schede Radeon Instinct MI25 si toccano i 400 TFLOPs di picco in uno chassis di dimensioni importanti ma che dalle immagini non dovrebbe occupare più di 7 unità rack.

slide_3.jpg (70120 bytes)

Usando una soluzione ad armadio rack a 42 unità Inventec arriva a offrire una potenza di calcolo di picco di 3 TeraFLOPs, integrando ben 120 schede Radeon Instinct MI25. Una proposta di questo tipo, nell'ottica di AMD e dei propri partner in questo settore, mira a offrire potenze di elaborazione da supercomputer in cluster di notevole complessità mantenendo gli ingombri complessivi all'interno di un singolo armadio rack così da facilitarne l'installazione in ambienti dedicati e non necessariamente in un grande datacenter.

slide_7.jpg (72189 bytes)

Da ultimo, uno sguardo in avanti alla metà del prossimo anno porta in modo pressoché naturale ad un abbinamento tra acceleratori Radeon Instinct e le future CPU AMD per sistemi server basate su architettura Zen, indicate con il nome in codice di Naples. Un abbinamento di questo tipo permetterà, secondo AMD, di ottenere una piattaforma di riferimento nel mondo delle elaborazioni di intelligena artificiale minimizzando dimensioni e latenza, con positive ricadute in termini di costi. Ma prima che questo avvenga sarà necessario attendere ancora alcuni mesi: AMD infatti annuncia quest'oggi la prima soluzione basata su GPU Vega ma la commercializzazione avverrà nel corso della prima metà del 2017, tempistica che del resto è allineata a quella di introduzione delle soluzioni server basate su piattaforma Naples.

47 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
demon7712 Dicembre 2016, 15:17 #1
Scusate, mi è molto chiaro il tipo di impiego, ma in compenso non mi è per nulla chiaro cosa hanno di speciale queste schede rispetto ad una normale fire pro.

Nel senso.. a livello hardware sono normalissimi acceleratori GPGPU come lo sono le schede tesla di Nvidia o gli xeon phi.
Non è che hanno implementato un chip apposito per questo tipo di lavoro..
Bivvoz12 Dicembre 2016, 15:25 #2
Originariamente inviato da: demon77
Scusate, mi è molto chiaro il tipo di impiego, ma in compenso non mi è per nulla chiaro cosa hanno di speciale queste schede rispetto ad una normale fire pro.

Nel senso.. a livello hardware sono normalissimi acceleratori GPGPU come lo sono le schede tesla di Nvidia o gli xeon phi.
Non è che hanno implementato un chip apposito per questo tipo di lavoro..


Può anche essere che sia solo un discorso di dissipazione e connessioni.
Cioè le firepro vanno tipicamente nelle workstation e hanno dissipazione attiva e connessioni video, queste vanno nei rack quindi hanno dissipazione passiva e non hanno bisogno di connessioni video.
Ovviamente per le mi6 e mi8, la mi25 è completamente nuova.
AceGranger12 Dicembre 2016, 15:38 #3
Originariamente inviato da: Bivvoz
Può anche essere che sia solo un discorso di dissipazione e connessioni.
Cioè le firepro vanno tipicamente nelle workstation e hanno dissipazione attiva e connessioni video, queste vanno nei rack quindi hanno dissipazione passiva e non hanno bisogno di connessioni video.
Ovviamente per le mi6 e mi8, la mi25 è completamente nuova.


le FirePro sono anche da server e sono anche passive.

Originariamente inviato da: demon77
Scusate, mi è molto chiaro il tipo di impiego, ma in compenso non mi è per nulla chiaro cosa hanno di speciale queste schede rispetto ad una normale fire pro.

Nel senso.. a livello hardware sono normalissimi acceleratori GPGPU come lo sono le schede tesla di Nvidia o gli xeon phi.
Non è che hanno implementato un chip apposito per questo tipo di lavoro..


niente di che, hanno semplicemente creato un nome nuovo stile Tesla per differenziare meglio i prodotti, molto probabilmente avranno loro driver specifici e non avranno uscite video; come con le Tesla ( esclusa la Tesla HBM2 che ha pure un form factor apposito ) cambiera ben poca roba fra Quadro e Titan.
Bivvoz12 Dicembre 2016, 15:40 #4
Originariamente inviato da: AceGranger
le FirePro sono anche da server e sono anche passive.



niente di che, hanno semplicemente creato un nome nuovo stile Tesla per differenziare meglio i prodotti, molto probabilmente avranno loro driver specifici e non avranno uscite video; come con le Tesla ( esclusa la Tesla HBM2 che ha pure un form factor apposito ) cambiera ben poca roba fra Quadro e Titan.


È vero, non ci avevo pensato.
Personaggio12 Dicembre 2016, 15:44 #5
3 PFLOPs con un armadio da 42 bay (un doppio armadio immagino) ma in ogni caso è veramente un grande passo in avanti, solo qualche anno fa fu presentato il primo server PFLOPs che occupava migliaia di mq ora lo possiamo fare in un solo armadio. Con queste configurazioni o con quelle della concorrenza, si può presto superare l'ExaFLOPs! Probabilmente già entro un anno.
AceGranger12 Dicembre 2016, 15:54 #6
Originariamente inviato da: Bivvoz
È vero, non ci avevo pensato.


comunque hanno fatto bene, fare il mistone con FirePro imho stava facendo casino, troppi numeri e troppe varianti con la stessa "Tag"; almeno cosi uno capisce subito di che prodotto si sta parlando e anche verso il mercato, ti proponi con una linea di prodotti specifica.

lato Pro parrebbe che finalmente si siano dati una svegliata, anche le nuove FirePro con SSD M2 sembrano molto interessanti
alexfri12 Dicembre 2016, 16:40 #7
Ma come cavolo é vestito sto tizio?? Ok che Steve Jobs faceva le presentazioni in jeans e magliettina, ma lui era mezzo sciroppato e lo possiamo scusare, ma questo scimmiotta la cosa senza sapere quanto é ridicolo có sta magliettina da Lanparty.
lookgl12 Dicembre 2016, 19:22 #8
Originariamente inviato da: alexfri
Ma come cavolo é vestito sto tizio?? Ok che Steve Jobs faceva le presentazioni in jeans e magliettina, ma lui era mezzo sciroppato e lo possiamo scusare, ma questo scimmiotta la cosa senza sapere quanto é ridicolo có sta magliettina da Lanparty.


https://youtu.be/eqCo0LTUhsE?t=3m56s
Bivvoz12 Dicembre 2016, 19:25 #9
Originariamente inviato da: alexfri
Ma come cavolo é vestito sto tizio?? Ok che Steve Jobs faceva le presentazioni in jeans e magliettina, ma lui era mezzo sciroppato e lo possiamo scusare, ma questo scimmiotta la cosa senza sapere quanto é ridicolo có sta magliettina da Lanparty.


Sto tizio è un tecnico, progetta le gpu, le schede video non è uno che fa le televendite come Jobs
CrapaDiLegno12 Dicembre 2016, 20:31 #10
Originariamente inviato da: Bivvoz
Sto tizio è un tecnico, progetta le gpu, le schede video non è uno che fa le televendite come Jobs


"sto tizio" non progetta GPU ma è il responsabile dello sviluppo dei driver AMD. E sì, fa televendita peggio di jobs a guardare le slide che realizza contro i risultati reali: Fiji doveva essere più veloce della 1080Ti, Polaris 10 doveva strapazzare Pascal in efficienza...
Questa scheda miracolosa con quasi le stesse prestazioni FP32 della Titan x va il 40% in più nel test indicato (che sarà il solito unico test dove AMD va più veloce di nvidia) e non sappiamo quanto consuma... Ovviamente di paragonarla alla scheda che monta il GP100 (che sarà stata disponibile per oltre un anno prima di questa al momento del ksncio) neanche a pensarci..
Jobs in confronto era un dilettante del marketing

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^