Examen de la GeForce GTX 750 Ti: Maxwell ajoute des performances en utilisant moins d'énergie

Présentation du GPU GM107, basé sur Maxwell

  • Page 1: Présentation du GPU GM107, basé sur Maxwell
  • Page 2: Carte de référence GeForce GTX 750 Ti de Nvidia
  • Page 3: OC Gaming MSI GTX 750 Ti
  • Page 4: Gigabyte GTX 750 Ti Windforce OC
  • Page 5: Zotac GTX 750 Ti
  • Page 6: Configuration des tests et benchmarks
  • Page 7: Résultats: Arma 3
  • Page 8: Résultats: Assassin's Creed IV: Black Flag
  • Page 9: Résultats: Battlefield 4
  • Page 10: Résultats: BioShock Infinite
  • Page 11: Résultats: Far Cry 3
  • Page 12: Résultats: Grille 2
  • Page 13: Résultats: Metro: Last Light
  • Page 14: Performances moyennes et performances par watt
  • Page 15: Boost GPU et overclocking
  • Page 16: GPGPU: performances en virgule flottante
  • Page 17: GPGPU: Bitcoin, Litecoin, LuxMark et RatGPU
  • Page 18: Applications professionnelles
  • Page 19: Températures et acoustique
  • Page 20: Consommation électrique: jeux
  • Page 21: Consommation électrique: veille, calcul, etc.
  • Page 22: Des performances folles pour une carte de 60 W

Présentation du GPU GM107, basé sur Maxwell

De nos jours, les joueurs aiment leurs cartes graphiques robustes. Les refroidisseurs à double fente et les carénages de ventilateurs sophistiqués sont généralement ce qui suscite des grognements de style Tim Allen et des hochements de tête. Après tout, des fréquences d'images élevées nécessitent des GPU complexes. Des milliards de transistors démarrant à Battlefield 4 chauffent. Et toute cette chaleur doit aller quelque part.

Donc, si vous venez à la table avec un PCB court et nu, il vaudrait mieux avoir un truc ou deux dans sa manche figurative.

Pourtant, Nvidia, essayant peut-être de prouver un point, a expédié sa GeForce GTX 750 Ti de référence sur une carte de moins de six pouces. Sans connecteur d'alimentation auxiliaire. Doté d'un petit dissipateur de chaleur et d'un ventilateur boulonnés de style orbe. C'est à peu près la même taille que la GeForce GTX 650 Ti. Mais sans le gros refroidisseur, la GTX 750 Ti est plus délicate que la plupart des cartes son que nous avons testées.

Néanmoins, Nvidia affirme que son premier produit basé sur l'architecture Maxwell cible les jeux en 1920 x 1080 dans les derniers titres en utilisant des paramètres assez exigeants. Serait-ce la Prius du monde graphique?

Maxwell au milieu

L'histoire de Maxwell est intrigante, en partie à cause de ce que cela signifie pour l'approche de conception de l'entreprise à l'avenir, mais aussi parce que Nvidia garde plus de détails architecturaux que d'habitude. Commençons par la conception.

En décembre de l'année dernière, nous étions à Santa Clara pour découvrir le SoC Tegra K1 de Nvidia. Nous savions déjà que le moteur graphique de K1 était basé sur Kepler, essentiellement un seul SMX avec des changements notables dans les structures reliant divers sous-systèmes dans le but d'optimiser la puissance. Mais Jonah Alben, vice-président senior de l'ingénierie GPU, a également précisé que chaque nouvelle architecture, à partir de Maxwell, serait conçue en pensant au mobile. Les ingénieurs optimiseraient les structures entre les composants du GPU en fonction des objectifs de performance et des budgets de puissance. Cependant, les éléments de base fondamentaux resteraient communs entre les segments et l'efficacité guiderait les décisions importantes.

Tegra: d'où il vient

L'impulsion de Maxwell vient des efforts de Nvidia dans l'espace des smartphones et des tablettes. Lisez Nvidia Tegra K1 en profondeur: la puissance d'une Xbox dans un SoC mobile? pour en savoir plus sur cette architecture.

Il s'agit clairement d'une bonne nouvelle pour la famille Tegra, qui continue de chercher une part de marché plus significative. Les appareils basés sur K1 ne sont même pas encore là et nous réfléchissons déjà à l'affirmation de Nvidia selon laquelle Maxwell offre deux fois les performances par watt de Kepler et à ce que des améliorations aussi importantes pourraient signifier pour le jeu mobile.

Un accent renouvelé sur l'efficacité devrait également être bon sur le bureau, à condition que l'architecture réorganisée de la société continue de passer de plafonds de puissance à un à deux et à trois chiffres.

Heureusement, vous n'aurez pas à attendre longtemps pour obtenir une réponse. Le lancement de la GeForce GTX 750 Ti aujourd'hui devrait démontrer ce que Maxwell peut faire (au moins à un TDP de 60 W). Nvidia affirme que sa conception plus efficace réduit considérablement la consommation d'énergie et augmente les performances, même dans un GPU comportant moins de cœurs CUDA. Sachant qu'elle n'aurait pas de nouveau nœud de technologie de processus sur lequel s'appuyer, Nvidia a dû apporter ses améliorations à Maxwell en gardant à l'esprit la fabrication 28 nm. En d'autres termes, il devait faire en sorte que ses GPU fonctionnent plus intelligemment, car il ne serait pas envisageable de simplement utiliser plus de ressources.

Le multiprocesseur Maxwell Streaming

Les représentants de l'entreprise nous disent que les gains les plus importants de Maxwell proviennent d'une refonte du multiprocesseur de streaming, désormais abrégé en SMM.

Dans Kepler, chaque SMX lit l'hôte de 192 cœurs CUDA, quatre programmateurs de déformation et un fichier de registre de 256 Ko. Il y a également 64 Ko servant de mémoire partagée et de cache L1, un cache de texture séparé et un cache uniforme, plus 16 unités de texture. Le grand saut dans le nombre de cœurs CUDA et la logique de contrôle a aidé Nvidia à surmonter la perte de la fréquence de shader doublée de Fermi. Mais le SMX s'est apparemment avéré difficile à utiliser pleinement dans cette configuration.

Maxwell tente de résoudre ce problème en partitionnant le SMX en quatre blocs, chacun avec son propre tampon d'instructions, son planificateur de distorsion et sa paire d'unités de répartition. Le fichier de registre de 256 Ko de Kepler est désormais divisé en quatre tranches de 64 Ko. Et les blocs ont chacun 32 cœurs CUDA, totalisant 128 à travers le SMM (contre 192 de Kepler). Les 32 unités de chargement / stockage et 32 ​​fonctions spéciales de l’architecture précédente sont transférées à Maxwell. Cependant, les mathématiques à double précision sont réduites à 1/32 du taux de FP32; c'était 1/24 dans les GPU traditionnels basés sur Kepler.

Par SM: GM107GK106RatioCUDA Cores1281922 / 3xUnités de fonction spéciale32321xLoad / Store32321xTexture Units8161 / 2xWarp Schedulers441xGeometry Engines111x

Chaque paire de blocs est liée à une texture de 12 Ko et à un cache L1, ajoutant jusqu'à 24 Ko par SMM. Les paires de blocs sont également associées à quatre unités de texture, ce qui signifie que les SMM sont armés de huit. C’est deux fois moins d’unités de texture que le SMX de Kepler. Et le tableau ci-dessus donne l'impression que le GM107 cède du terrain au GK106. Mais ne vous inquiétez pas encore des goulots d’étranglement. N'oubliez pas que l'architecture est censée faire plus en utilisant moins de ressources.

Enfin, il existe un espace de mémoire partagée de 64 Ko pour le SMM, qui est transféré de Fermi puis de Kepler, mais n'est plus appelé comme cache L1 pour les tâches de calcul. Auparavant, cet espace pouvait être configuré comme 48 Ko d'espace partagé et 16 Ko de L1 et vice versa. Ce n'est plus nécessaire, les 64 Ko sont donc utilisés comme espace d'adressage partagé pour le calcul GPU.

Comme vous pouvez l'imaginer, couper 64 cœurs CUDA et huit unités de texture à partir du SMM signifie que chaque bloc de construction consomme beaucoup moins de taille de matrice. Pendant ce temps, Nvidia prétend pouvoir tenir le coup

90% des performances du multiprocesseur en gardant les cœurs occupés de manière soutenue. Si vous envisagez ce que cela pourrait signifier pour une tablette, vous n'êtes pas seul. Mais dans une application de bureau, Nvidia est simplement en mesure d’emballer plus de SMM dans un espace défini. La GeForce GTX 650 Ti cette carte remplace quatre blocs SMX employés, tandis que la GeForce GTX 750 Ti incorpore cinq SMM.

Construction de GM107

C'est la première fois que nous voyons Nvidia introduire une nouvelle architecture sur une carte graphique résolument milieu de gamme. Avec Fermi, c'était le GF100 à pleine puissance. Même le GK104 basé sur Kepler était un moyen incroyablement rapide de répondre à cette architecture. Ainsi, la messagerie est un peu différente avec GM107 en tête. Bien sûr, c'est parce que la GeForce GTX 750 Ti doit s'inscrire dans un portefeuille toujours dominé par Kepler, plutôt que de simplement monter sur un trône.

Pour ce faire, il utilise une implémentation entièrement activée de GM107, composée de cinq SMM dans un seul cluster de traitement graphique avec son propre moteur raster. GM107 peut configurer une primitive visible par cycle d'horloge, ce qui est juste derrière le taux primitif de GK106 de 1,25 prim / horloge et le double de 0,5 prim / horloge de GK107.

Comme dans les architectures Nvidia précédentes, les partitions ROP et les tranches de cache L2 sont alignées. Et comme le processeur GK106 de la GeForce GTX 650 Ti, le GM107 comporte deux partitions de huit unités chacune, vous donnant jusqu'à 16 pixels entiers de 32 bits par horloge. Là où les deux GPU divergent vraiment, c'est leur capacité de cache L2. Dans GK106, vous recherchiez 128 Ko par tranche, ajoutant jusqu'à 256 Ko dans une implémentation avec deux partitions ROP. GM107 semble utiliser 1 Mo par tranche, ce qui donne 2 Mo de mémoire utilisée pour les demandes de charge, de stockage et de texture. Selon Nvidia, cela se traduit par une charge importante éloignée du système de mémoire externe, ainsi que par des économies d'énergie notables.

Simplifier la bande passante mémoire est intelligent, car le GM107 expose une paire de contrôleurs de mémoire 64 bits auxquels 1 ou 2 Go de DRAM GDDR5 à 1350 MHz est attaché. Le débit maximal est, de manière intéressante, exactement ce que nous avons obtenu de la GeForce GTX 650 Ti: 86,4 Go / s. La mémoire alimente moins de cœurs CUDA, mais ils sont gérés plus efficacement. Ainsi, la grande L2 est censée jouer un rôle déterminant dans la prévention d'un goulot d'étranglement.

En effet, un examen des latences globales du cache aléatoire sur la page permet d'illustrer comment la hiérarchie de mémoire de Maxwell maintient le GPU occupé de manière plus cohérente.

Au-delà des éléments de GM107 consacrés aux jeux et aux tâches de calcul, Nvidia affirme également avoir amélioré le bloc NVEnc à fonction fixe. C'est le peu de logique responsable de laisser ShadowPlay encoder votre frag fest avec un impact minimal sur les performances. C’est ce qui permet le streaming vers le Shield. Et il accélère quelques applications de transcodage pour obtenir rapidement de gros films sur vos appareils portables. Alors que Kepler était capable d'encoder du contenu basé sur H.264

4x plus rapide que le temps réel, Maxwell est censé atteindre 6 à 8 fois le temps réel. Les performances de décodage H.264 seraient également huit à 10 fois plus rapides qu'auparavant. Nvidia réalise ces gains, dit-il, en accélérant simplement les blocs à fonctions fixes.

GeForce GTX 650GeForce GTX 650 TiGeForce GTX 750 TiGeForce GTX 660GPUGK107GK106GM107GK106ArchitectureKeplerKeplerMaxwellKeplerSMs2455GPCs1213Shader Cores384768640960Texture Units32644080ROP Units16161624Process Node28 nm28 nm28 nm28 nmCore / Poussée Clock1058 MHz925 MHz1020 / 1085 MHz980 / 1033 MHzMemory Clock1250 MHz1350 MHz1350 MHz1502 MHzMemory Bus128-bit128-bit128-bit192-bitMemory Bandwidth80 GB / s86,4 Go / s86,4 Go / s144,2 Go / s RAM graphique (GDDR5) 1 ou 2 Go1 ou 2 Go1 ou 2 Go2 GBPConnecteurs d'alimentation1 x 6 broches1 x 6 brochesNon1 x 6 brochesTDP64 maximum W110 W60 W140 WPrix 130 $ (2 Go) 150 $ (2 Go) 150 $ (2 Go) 190 $ (2 Go)

Au total, le GPU GM107 se retrouve avec 1,87 milliard de transistors dans une matrice de 148 mm². Si vous maintenez la comparaison avec la GeForce GTX 650 Ti, alors le premier processeur basé sur Maxwell remplace le GK106, qui contient 2,54 milliards de transistors dans une matrice de 221 mm². Avant d'arriver à nos résultats de performance, nous devons supposer que l'accent mis par Nvidia sur l'efficacité est suffisamment important pour permettre à l'entreprise d'utiliser moins de transistors sur une matrice plus petite, de découper un grand nombre de cœurs CUDA et d'unités de texture, et d'améliorer encore les performances globales. Du moins, c’est ce que nous recherchons…

Alternativement, vous pouvez confronter le GM107 au 1,3 milliard de transistors, 118 mm² GK107, si votre préférence est une confrontation avec les plafonds thermiques. Dans ce cas, le processeur basé sur Maxwell est plus complexe, plus gros, nettement plus rapide, et pourtant il devrait toujours utiliser moins d'énergie.

  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 22

Page actuelle: Présentation du GPU GM107, basé sur Maxwell

Fuite des spécifications et des benchmarks de la NVIDIA GeForce GTX 750 Ti

Il semble que les premiers GPU Maxwell soient déjà à l'état sauvage. Heureusement pour nous, un membre des forums PCOnline a eu l'occasion de tester la prochaine GTX 750 Ti de NVIDIA.

Spécifications de la NVIDIA GeForce GTX 750 Ti

Selon la capture d'écran GPU-Z divulguée, le premier GPU basé sur Maxwell porterait 960 cœurs CUDA. En fait la configuration de cette carte est assez intéressante. Tout en ayant un grand nombre de cœurs CUDA, il n'a que 16 ROP et une interface mémoire de 128 bits. C'est certainement un goulot d'étranglement.

En dehors de l'interface 128b, nous avons 2 Go de mémoire GDDR5, ce qui est bien, je suppose. Gardez à l'esprit cependant qu'il n'offre qu'une bande passante de 86,4 Go / s, tout comme 650 TI.

Videos about this topic

Msi Geforce GTX 750 ti OC 2GB GDDR5 review - does the Card hold well in 2016?
GTX 750Ti vs GT 1030 Gaming Benchmarks!
GTX 750 Ti 2GB vs GTX 750 Ti 4GB | New Games Benchmarks
GT 710 | Fortnite Chapter 2 / Season 3 - 77p, 144p, 270p, 360p, 480p, 540p, 720p, 900, 1080p
Hats Off to The GTX 750 Ti!
What it feels like to get a GTX 750 ti