Gigabyte GV-NX76T256D-RH: GeForce 7600GT

Pag. 3 - CineFX4.0

Per analizzare il contenuto tecnologico della nuova serie GeForce 7x00, vogliamo dapprima concentrarci sulle potenzialità di G71, il fiore all'occhiello della serie, per poi andare a vedere tutte le semplificazioni realizzate nelle implementazioni di fascia inferiore.

G71 (alias GeForce 7900) conserva lo stesso bagaglio tecnico di G70 (meglio noto come GeForce 7800) nelle linee base: 8 motori di elaborazione vertici forniscono dati a 24 pipeline che si appoggiano su 16 ROP per la visualizzazione finale dell’immagine. Ciò che cambia sono le frequenze operative di GPU e memorie che passano dai 550Mhz/1.7Ghz del GeForce 7800GTX con 512Mb di memoria ai ben 650Mhz per la GPU e 1.6Ghz per le memorie.

Anche le ROP conservano le proprie qualità e, lo ricordiamo, si occupano di operazioni di blending, stencil buffer e scrittura nel frame buffer. Come in G70, le ROP possono scrivere 2X operazioni di z-buffer e stencil buffer per ogni ciclo di clock, ma hanno il limite di non poter gestire il FSAA con operazioni di blending in floating point; da qui l’incapacità di gestire il FSAA con HDR attivo.

Il frame buffer è di tipo integer a 8 bit per ciascuna componente di colore, FP16 e FP32.

Il motore di shading permane il CineFX nella versione 4.0, per cui G71 condivide le stesse modalità di FSAA e filtro Anisotropico.

Rispetto al motore CineFX 3.0, presente sulle GPU della passata generazione e della serie GeForce 6xxx, abbiamo avuto un miglioramento globale dell’efficienza elaborativa dei vertici e nel setup dei triangoli oltre che un potenziamento, passando dai 6 motori di vertex shader agli 8 attuali; tutte le applicazioni che fanno uso intensivo di poligoni o ombre ne traggono vantaggio. Inoltre nVidia sembra aver reso più veloci anche le singole unità di circa il 30% sulle operazioni scalari.


G71 cela in ciascuna delle sue 24 pipeline, una unità di pixel shading che presenta 2 ALU e 1 TMU; ogni ALU, a sua volta, supporta modalità di calcolo con precisione in virgola mobile FP16 e FP32 ed è capace di elaborare 4 MADDs (Multiply and accumulate) per ciclo di clock. Queste ultime, in particolare, sono state potenziate e si riferiscono ad operazioni composte di moltiplicazioni e addizioni: trasformazioni, illuminazione, mappe normali, ecc.. Proprio per via del raddoppio delle ALU, la potenza di elaborazione aritmetica è parimenti raddoppiata con notevole vantaggio per le operazioni di illuminazione che fanno uso intensivo di tali capacità. Inoltre nVidia ha pensato di creare una sorta di dipendenza tra una delle 2 ALU e la TMU in ciascuna unità di pixel shading con elevate flessibilità: questo significa che, a seconda di quanto richiesto dall’applicativo, G71 sarà capace di offrire 8 MADDs su ciascuna delle 24 unità di shading oppure 4 MADDs ed una texture fetch. Ogni ALU ha la sua unità di Vertex Texture Fetch collegata ad una sorta di cache esclusiva per le texture e anche una di branching (come da direttiva dello SM 3.0). In definitiva le TMU sono state ottimizzate nella capacità di accesso alle texture per diverse dimensioni dei texel con nuovi algoritmi; inoltre, grazie alla nuova cache integrata, tutte le operazioni di blending e filtraggio sono state accelerate (si pensi al FSAA o, meglio, al filtro Anisotropico). G71, come G70, supporta texture fixed-point da 8bit (con compressione 3Dc), FP16 e FP32.

 

 

Scritto da nico64 | il 2006-06-06 00:00:00 |

Annunci Google