[ Samedi 27 mars 2010 ] par Guillaume Louel
GeForce GTX 480 : Nvidia revient, enfin !
   
|
 Prix en boutique (hors frais de port)
GIGABYTE NVIDIA GeForce GTX 580 Grosbill 457.90 €
Gigabyte GV N580D5-15I-B - Carte graphique - GF GTX 580 - PCI Express 2.0 x16 - 1.5 Go GDDR5 - DVI, HDMI ( HDCP ) Amazon.fr MarketPlace 554.81 €
Carte Graphique Nvidia Gigabyte Carte graphique GIGABYTE GV N580UD 15I GeForce GTX 580 1536 Mo PCI Express Rue du Commerce 449.90 €


Nvidia GeForce GTX 480 : 3 milliards de transistors



Au cœur de la GeForce GTX 480, il y a avant toute chose un énorme GPU. Un processeur de près de 3 milliards de transistors, à titre de comparaison le processeur six cœurs d’Intel, le Core i7 980X que nous vous présentions la semaine dernière n’en comporte que 1.17 milliard, tandis que la puce RV870 qui anime les Radeon HD 5800 en compte 2.1 milliards. Nvidia propose donc le plus gros GPU de l’histoire et c’est par là aussi que les problèmes sont arrivés. Plus un processeur est gros et plus il est compliqué à mettre au point et à fabriquer. A titre de comparaison, la génération précédente de Nvidia incarnée par le GT200b culminait à 1.4 milliards de transistors à l’époque.

Pourquoi fabriquer un GPU si gros ? C’est une vraie question d’orientation. Ceux qui ont de la mémoire se rappelleront qu’ATI aussi réalisait de telles puces à son époque. Pour une gamme donnée on retrouvait par exemple le R600, qui était suivi peu après d’une version un peu plus abordable (RV670) et d’autres déclinaisons. La dernière fois qu’AMD s’est lancé dans ce jeu, c’était avec le R600 justement que l’on appelait Radeon HD 2900 XT. Depuis, les puces proposées par AMD sont plus petites et plus modestes.

Nvidia de son côté continue dans la voie des gros GPU, une voie qui n’est pas mauvaise quand la fabrication et la mise au point suivent, ce qui n’aura pas été le cas pour cette génération et qui fait que ce n’est que six mois après la date attendue que le GF100 sort. A la décharge de Nvidia, le GF100 a été conçu dans un climat graphique compliqué, les rumeurs parlaient déjà du Larrabee d’Intel et chez Nvidia, on misait fort sur CUDA et les applications accélérées par le GPU (le concept du GPU Computing).

Que trouve-t-on à l’intérieur du GF100, donc ? 512 unités de calcul scalaires quand le GT200b en comptait 320. Le bon en avant est donc significatif même si, comme nous allons le voir, toutes ces unités ne sont pas activées.

Techniquement le GF100 est composé de seize gros blocs baptisés SM par Nvidia et que l’on pourrait comparer à des cœurs de processeurs. Ils incluent chacun un scheduler (appelé polymorph engine), 32 unités scalaires ainsi que divers caches et registres. Quelques particularités à noter, tout d’abord le fait que Nvidia soit revenu à des unités de textures intégrées directement dans ces blocs fonctionnels pour limiter au minimum la latence. C’est un des retours en arrière qu’avait également effectué AMD dans son RV770. Quatre unités de textures sont donc asservies pour ce bloc fonctionnel. On notera également que Nvidia a fait un gros travail sur les caches et registres avec un cache de niveau 1 important (64 Ko) intégré dans chaque groupe.

C’est quand l’on regarde un niveau au dessus que l’on voit les choses les plus intéressantes tout de même dans l’architecture de Nvidia. Tout d’abord le fait qu’il existe désormais un vrai cache de niveau 2 (768 Ko) partagé entre tous les SM. Il est connecté lui-même à six contrôleurs mémoires 64 bits ce qui nous donne au total une architecture mémoire 384 bits connectée à de la mémoire GDDR5. Un vrai sous système mémoire complet et évolué comme l’on en trouve sur des processeurs traditionnels. Les GPU et les processeurs viendront à fusionner et c’est sans surprise que l’on voit Nvidia tenter de faire des GPU qui ressemblent de plus en plus à des CPU, et qu’Intel essaye l’inverse avec ses projets Larrabee (en version 2, le premier ayant été rangé au placard suite à un… beau et copieux ratage, disons les choses clairement).

Reste un point d’architecture particulièrement intéressant dans celle de Nvidia, le constructeur a coupé en quatre son Raster Engine qui s’occupe de la phase de rasterisation (transformation 3D/2D). Là ou ATI permet de traiter un triangle avec jusqu'à 32 pixels par cycle, chez Nvidia on peut travailler sur quatre triangles en simultanée de 8 pixels. En théorie cela revient au même en terme de débit : la différence est au niveau de la flexibilité. L’architecture de Nvidia disposera d’un avantage massif lorsque la géométrie est nombreuse et équipée de beaucoup de petits triangles.

Sans vous raconter la fin de notre article, il y a deux cas dans lesquels on trouve de petits triangles. Tout d’abord quand la résolution est plus faible. Les triangles sont composés de moins de pixels, et donc l’architecture de Nvidia devrait être particulièrement à l’aise dans ces cas. Le second est lorsque l’on abuse de la géométrie, ce qui est le principe de la tesselation. Nous vous renvoyons à nos articles sur le HD 5870 pour plus de détails, cependant le principe de la tesselation est simple. Il s’agit d’effectuer une augmentation du niveau de géométrie à l’intérieur du GPU, sans passer par la mémoire. Il s’agit donc de géométrie instanciée à la volée et dont on peut définir la complexité. Vous voyez venir l’astuce, si l’on génère énormément de géométrie… on se retrouve avec un très grand nombre de petits triangles.

Globalement on reste tout de même assez séduits par le travail effectué par Nvidia pour son architecture GF100 qui, si elle ne révolutionne pas totalement le genre, offre des perspectives intéressantes pour l’avenir, particulièrement si la révolution promise du GPU computing arrivait de manière réelle sur nos PC de bureau (dans des applications réelles comme peut être la suite Adobe CS5, et non de l’encodage de vidéo vers l’iPhone). Nvidia est placé, reste à voir si le reste suivra.




< Nvidia GeForce GTX 480Nvidia GeForce GTX 480 : La carte, caractéristiques >

Les Cartes graphiques déjà testés
 COMPARATEUR DE PRIX 
Trouvez le meilleur prix
OK