POV GF4 MX440

Pag. 2 - Caratteristiche


Il nuovo GeForce4 arriva al pubblico con una serie di caratteristiche che non sono solo migliorie di quelle già presenti nel GeForce3. Forse uno dei difetti più grandi della tecnologia nVidia era la gestione della banda passante non all’altezza delle prestazioni geometriche del core. A questo limite, la casa di Santa Clara propone un rimedio chiamato Lightspeed Memory Architecture II (LMAII). Consapevoli dell’enorme quantità di dati che una scheda grafica è chiamata a gestire, è facile intuire quanto sia importante avere una banda di memoria il più ampia possibile. L’LMAII è una tecnologia che incorpora sei diverse tecniche, la cui combinazione ottimizza al massimo la banda di cui si dispone. La più importante è senza dubbio il Crossbar Memory Controller. La memoria video contiene differenti buffer: frame buffer, video buffer, z/stencil buffer, geometry buffer, texture buffer, ecc. e con un bus a 128bit DDR, le informazioni sono trasferite in grossi blocchi dalle dimensioni fisse di 256bit; è facile comprendere come, nel caso si necessiti di molti meno bit (ad esempio 64), si assista ad uno spreco di banda passante (ben ¾ utilizzata inutilmente).Perciò nVidia ha pensato di porre tra GPU e memoria dei controller (2 per la versione MX a 64bit e 4 per quella Titanium a 32bit) al fine di accedere con la massima efficienza alla memoria.




Secondo nVidia questo approccio raddoppia le prestazioni su una MX e le quadruplica su una Titanium. I controller sfruttano sempre al meglio la banda, richiamando i blocchi di dati di cui si necessita a 64, 128 e 256bit permettendo di ridurre la cosiddetta “granulosità" dell’accesso ed effettuare fino a quattro accessi contemporanei alla memoria in buffer distinti. La Quad Cache è un sistema di quattro cache indipendenti in cui vengono memorizzati i dati relativi a vertici, texture e pixel. Perciò è possibile richiamare tali informazioni ad altissima velocità senza che vengano richiamati dalla memoria e ricalcolati ogni volta. La Lossless Z-compression è una tecnica di compressione dei dati relativi alla profondità di ogni pixel. nVidia ha pensato di comprimere i dati che viaggiano da e verso lo Z-buffer con un’ulteriore risparmio della banda passante. Con questo algoritmo tali informazioni sono ridotte fino a quattro volte e compressione e decompressione avvengono istantaneamente e senza perdita di qualità. Con lo Z-occlusion Culling si calcolano solo i pixel realmente visibili ottenendo un miglioramento delle performance direttamente proporzionale alla complessità di profondità dell’applicazione corrente. Su richiesta dell’applicazione (Occlusion Query), la GPU circoscrive gli oggetti in una “scatola" (bounding box) ed effettua un controllo preventivo: se questa scatola è totalmente occultata, la si tralascia, altrimenti si procede al calcolo completo dell’oggetto. L’Auto Pre-Charge permette un più veloce accesso ai banchi di memoria organizzati in una matrice con righe e colonne. Con tale tecnica non è necessario attendere la chiusura del banco corrente prima di poter spostarsi e poi accedere ad un altro, poiché la GPU riesce ad attivarne uno nuovo in anticipo risparmiando preziosi cicli di clock. In ultimo il Fast Z-clear, che permette la “pulizia" dello Z-buffer (assegnazione del valore 0 a tutte le locazioni di memoria ad alta velocità). Questa operazione è essenziale al fine di evitare l’insorgenza di artefatti o irregolarità in fase di rendering e necessita di essere svolto il più velocemente possibile. Tutte queste tecniche ottimizzano la gestione della banda passante creando sensibili incrementi di prestazioni. Un’ulteriore caratteristica del GeForce4 è il motore di Antialiasing: l’Accuview AA. Si è ormai abbandonato il superato Supersampling per adottare il più sofisticato e performante Multisampling in modalità 2x, 4x, Quincunx e 4xS. Ricordiamo che nel Supersampling ciò che conta è essenzialmente la forza bruta, poiché ogni frame viene semplicemente elaborato a risoluzione doppia (2x) o quadrupla (4x) e scalato prima della visualizzazione. Con il Multisampling, ad ogni pixel, campionato più volte, si applicano le stesse texture (con risparmio della banda passante perché già calcolate ed elaborate). Si incrementano le prestazioni ma si riduce la qualità perché si utilizzano gli stessi dati di colore. Consideriamo le modalità 2x e Quincunx: in entrambe si considerano due campioni per ogni pixel ma ora, invece che porre il texel della prima campionatura nella sua posizione corretta ed il secondo ad una certa distanza dal primo in posizione “non corretta", si pongono ambedue in locazioni non corrette ma tali da generare un risultato qualitativamente migliore.




Detto in altre parole, si è preferito porre i due texel in posizioni di poco non corrette piuttosto che uno in posizione corretta e l’altro molto “distante" da questo. Ricordiamo che il Quincunx è una modalità di AA proprietaria che replica ciascun frame due volte in modo tale che la seconda passata si discosti dalla prima (alla quale si sovrappone) di ½ pixel in orizzontale e verticale. Così facendo ogni pixel della prima copia è sovrapposto a quattro dell’altra sfruttando un particolare tipo di filtraggio. La nuova modalità 4xS (utilizzabile solo in ambito Direct3D) è in realtà una 6x poiché sfrutta il 50% di campioni in più rispetto alla modalità 4x. Il 4xS permette di realizzare texel che derivano dalla somma pesata di ben sei campioni e permette, perciò, una miglior resa delle sfumature di colore nonché della qualità d’immagine nel suo insieme.


Particolare a 1024x768(a sinistra), con FSAA 2x (al centro), con FSAA QuincunxÂ… (a destra)



Â…con FSAA 4x ( a sinistra), con FSAA 4XS (al centro), con FSAA 4x, filtro anisotropico e sharpen texture (a destra)

Ma nVidia ha migliorato tutta la pipeline grafica per gestire meglio le immagini sottoposte ad AA: tutti i campioni sono renderizzati in parallelo (grazie al multisampling) in un back buffer più grande del frame buffer che conterrà l’immagine finale; poi l’immagine è filtrata, scritta nel frame buffer e visualizzata. Grazie all’elaborazione in parallelo, l’incremento velocistico è sensibile in ogni modalità FSAA. La gestione della riproduzione video è affidata al VPE (Video Processing Engine) che offre decodifica MPEG2 in hardware, deinterlacciamento adattivo, gestione HDTV avanzata e accelerazioni di funzioni di registrazione video come il time-shifting nel campo del Personal Video Recorders (PVRs). E’ previsto il supporto iDCT, compensazione del moto, quantizzazione inversa (IQ), ecc..


L’ultima caratteristica del prodotto di nVidia è l’nView, ovvero la tecnologia di gestione multi-monitor. Il chip integra due Ramdac da 350Mhz a 10bit per gestire monitor e TV, e, grazie alle potenzialità racchiuse nei driver Detonator, si può gestire al meglio il multi-desktop e il Digital Vibrance Color (DVC) con cui è possibile impostare la resa comatica di ogni apparato di visualizzazione in modo distinto.






















Scritto da Staff | il 2002-11-21 00:00:00 |

Annunci Google