Flex FP: floating point per i futuri server AMD

Flex FP: floating point per i futuri server AMD

AMD illustra alcune delle peculiarità tecnologie della propria Flex FP, unità di calcolo in virgola mobile che verrà integrata nelle future cpu basate su architettura Bulldozer

di pubblicata il , alle 11:47 nel canale Private Cloud
AMD
 
18 Commenti
Gli autori dei commenti, e non la redazione, sono responsabili dei contenuti da loro inseriti - info
calabar29 Ottobre 2010, 14:28 #11
@coschizza
Sebbene il modulo sia l'unità costruttiva di Bulldozer, i core int per modulo sono di fatto due, cosa ben diversa dal singolo core con SMT degli attuali processori intel.
elessar29 Ottobre 2010, 14:31 #12
Una cosa che non comprendo è:

per quale motivo una cpu di fascia server ? Potevo capirla su una CPU dedicata ai gamer, dove qualche volta la FPU è sfruttata per tutti i calcoli complessi che ancora non si riesce a demandare alla scheda grafica.

Se è un server dedicato ad un servizio generico, come un server web, un database, ecc. ecc. la FPU è generalmente poco utilizzata e non costituisce di per sé un collo di bottiglia.

Se è un server dedicato ad un qualsiasi tipo di calcolo numerico, sono certo al 99% che utilizzare un'architettura dedicata più efficiente - leggi GPGPU - darà in ogni caso risultati migliori rispetto a qualsiasi FPU, incluse queste nuove estensioni, a parità di costo.

Perciò? A chi serviranno?
marchigiano29 Ottobre 2010, 15:00 #13
Originariamente inviato da: coschizza
per sfruttare le estensioni AVX bisogna cambiare il codice quindi dobbiamo aspettare che i programmi ne facciano uso e comunque è piu probabile vedere vantaggi prima sui desktop che sui server proprio perche gia adesso i programmatori di codec encoder ecc stanno lavorando su quento


con la speranza che non si creino conflitti con l'architettura BD, un bug è sempre dietro l'angolo, magari con le avx viene sfruttato un solo core logico oppure nelle istruzioni a 128bit la fpu non riesce a fare due calcoli in parallelo...

sarebbe un bel danno per amd nel segmento desktop
coschizza29 Ottobre 2010, 15:09 #14
Originariamente inviato da: elessar
Se è un server dedicato ad un qualsiasi tipo di calcolo numerico, sono certo al 99% che utilizzare un'architettura dedicata più efficiente - leggi GPGPU - darà in ogni caso risultati migliori rispetto a qualsiasi FPU, incluse queste nuove estensioni, a parità di costo.

Perciò? A chi serviranno?


solo una parte dei software possono essere adattati per sfruttare la GPGPU quindi devi avere alterantive per poter gestire tutte la possibilità che nel campo software sono molte

inoltre non pensare che una ruotine fatta per GPGPU dia risultati migliori della stessa eseguita sulla cpu, questo perche appunto non tutti i codici sono parralelizzabili ed eseguibili con la stessa efficienza sui vari sistemi

La prossima cpu intel sb ha messo in campo un esempio pratico di quello che ti sto dicendo, all'interno ha un encoder video hardware che occupa solo 3mm quadrati ed è composta solo da funzioni fisse come si faceva una volta, il risultato è che puo eseguire codifica di flussi video alla pari di una gpu che pero consuma 100 di piu con un costo infinitamente maggiore e un consumo di spazio sul die nemmeno confrontabile.

Quindi le sse, vmx ecc non sono sostituibili a prescindere da funzioni GPGPU perche poi a livello pratico possono essere piu sconvenienti in base a cosa devono eseguire
cionci29 Ottobre 2010, 15:16 #15
Originariamente inviato da: marchigiano
questa architettura bulldozer può andare per server e workstation, dove puoi ricompilare i software con le nuove istruzioni, ma nei computer che abbiamo a casa come si comporteranno?

Sono assolutamente retrocompatibili con il codice SSEx e legacy esistente.
Originariamente inviato da: elessar
Una cosa che non comprendo è:

per quale motivo una cpu di fascia server ? Potevo capirla su una CPU dedicata ai gamer, dove qualche volta la FPU è sfruttata per tutti i calcoli complessi che ancora non si riesce a demandare alla scheda grafica.

Se è un server dedicato ad un servizio generico, come un server web, un database, ecc. ecc. la FPU è generalmente poco utilizzata e non costituisce di per sé un collo di bottiglia.

Se è un server dedicato ad un qualsiasi tipo di calcolo numerico, sono certo al 99% che utilizzare un'architettura dedicata più efficiente - leggi GPGPU - darà in ogni caso risultati migliori rispetto a qualsiasi FPU, incluse queste nuove estensioni, a parità di costo.

Perciò? A chi serviranno?

Il GPGPU ha ottime prestazioni solo con singola precisione. In doppia precisione le prestazioni si riducono ad 1/4.
Originariamente inviato da: marchigiano
con la speranza che non si creino conflitti con l'architettura BD, un bug è sempre dietro l'angolo, magari con le avx viene sfruttato un solo core logico oppure nelle istruzioni a 128bit la fpu non riesce a fare due calcoli in parallelo...

sarebbe un bel danno per amd nel segmento desktop

Perché si dovrebbero creare conflitti ? E' una gufata ? Non capisco
La FPU di Bulldozer di fatto è una unità SMT, le istruzioni dei vari thread vengono mescolate ed in ogni istante ad un thread possono venire assegnate due unità FMAC, una unità FMAC o nessuna. Questo è appunto il motivo per cui si chiama Flex FP: cioè Flexible...
riuzasan29 Ottobre 2010, 16:57 #16
Originariamente inviato da: cionci
Sono assolutamente retrocompatibili con il codice SSEx e legacy esistente.

Il GPGPU ha ottime prestazioni solo con singola precisione. In doppia precisione le prestazioni si riducono ad 1/4.

Perché si dovrebbero creare conflitti ? E' una gufata ? Non capisco
La FPU di Bulldozer di fatto è una unità SMT, le istruzioni dei vari thread vengono mescolate ed in ogni istante ad un thread possono venire assegnate due unità FMAC, una unità FMAC o nessuna. Questo è appunto il motivo per cui si chiama Flex FP: cioè Flexible...


Ma infatti Cionci, io non capisco tutti questi commenti assurdi e fuori luogo.
AMD sta semplicemeno introducendo una FPU più avanzata e complessa che, nelle intenzioni di AMD, sarà la vera punta di diamante delle sue future CPU (oltre all'unità grafica integrata).
cionci29 Ottobre 2010, 18:37 #17
Diciamo che in Bulldozer le innovazioni sono tante. La FPU, se pur innovativa, è a tutti gli effetti una unità SMT, di conseguenza fino a quando sarà dedicata ad un solo thread le prestazioni saranno stratosferiche. Quando però sarà utilizzata contemporaneamente da entrambi i thread allora le prestazioni dovrebbero calare di una percentuale non indifferente.
Certo beccare due thread non concorrenti (se sono in concorrenza la probabilità che uno dei due sia bloccato aumenta) che utilizzano la FPU non è così frequente in un utilizzo comune di server e desktop, tranne forse nell'utilizzo multimediale, encoding soprattutto, visto che il decoding sarà sempre più spesso demandato alla GPU.
La novità più grossa secondo me sono i due core INT nella stessa CPU. Questa sì che è una novità addirittura epocale. Soprattutto visto che le prestazioni a parità di frequenza saranno nettamente superiori ad un dual core della generazione precedente, ma con uno spazio occupato nettamente inferiore.
yossarian31 Ottobre 2010, 15:15 #18
Originariamente inviato da: elessar
Una cosa che non comprendo è:

per quale motivo una cpu di fascia server ? Potevo capirla su una CPU dedicata ai gamer, dove qualche volta la FPU è sfruttata per tutti i calcoli complessi che ancora non si riesce a demandare alla scheda grafica.

Se è un server dedicato ad un servizio generico, come un server web, un database, ecc. ecc. la FPU è generalmente poco utilizzata e non costituisce di per sé un collo di bottiglia.

Se è un server dedicato ad un qualsiasi tipo di calcolo numerico, sono certo al 99% che utilizzare un'architettura dedicata più efficiente - leggi GPGPU - darà in ogni caso risultati migliori rispetto a qualsiasi FPU, incluse queste nuove estensioni, a parità di costo.

Perciò? A chi serviranno?


Originariamente inviato da: coschizza
solo una parte dei software possono essere adattati per sfruttare la GPGPU quindi devi avere alterantive per poter gestire tutte la possibilità che nel campo software sono molte

inoltre non pensare che una ruotine fatta per GPGPU dia risultati migliori della stessa eseguita sulla cpu, questo perche appunto non tutti i codici sono parralelizzabili ed eseguibili con la stessa efficienza sui vari sistemi

La prossima cpu intel sb ha messo in campo un esempio pratico di quello che ti sto dicendo, all'interno ha un encoder video hardware che occupa solo 3mm quadrati ed è composta solo da funzioni fisse come si faceva una volta, il risultato è che puo eseguire codifica di flussi video alla pari di una gpu che pero consuma 100 di piu con un costo infinitamente maggiore e un consumo di spazio sul die nemmeno confrontabile.

Quindi le sse, vmx ecc non sono sostituibili a prescindere da funzioni GPGPU perche poi a livello pratico possono essere piu sconvenienti in base a cosa devono eseguire


Originariamente inviato da: cionci
Sono assolutamente retrocompatibili con il codice SSEx e legacy esistente.

Il GPGPU ha ottime prestazioni solo con singola precisione. In doppia precisione le prestazioni si riducono ad 1/4.


come spiegato da coschizza, il gpgpu va bene solo in alcuni ambiti. Per il resto, il modello di programmazione delle gpu è troppo poco flessibile rispetto a quello delle cpu. Molto meglio avere una APU con cpu+gpu o cpu+fpu; in questo modo è possibile unire la potenza di calcolo di una unità fp dedicata con la flessibilità di una cpu. Al discorso flessibilità è legato anche quello relativo alla compatibilità. L'utilizzo di una gpu per calcoli gp obbliga al ricorso a middleware come CUDA, CAL o OpenCL

Devi effettuare il login per poter commentare
Se non sei ancora registrato, puoi farlo attraverso questo form.
Se sei già registrato e loggato nel sito, puoi inserire il tuo commento.
Si tenga presente quanto letto nel regolamento, nel rispetto del "quieto vivere".

La discussione è consultabile anche qui, sul forum.
 
^