ARTIKEL/TESTS / ZOTAC GeForce RTX 3080 AMP Holo im Test

GPU-Architektur

Ampere ist die Next-Gen GPU-Architektur, die Nvidia im September letztes Jahr offiziell als Turing-Nachfolger vorgestellt hat und seither im Markt platziert. Flaggschiff der Familie ist der GA102-Grafikchip, der in einem 8-nm-Fertigungsverfahren von Partner Samsung produziert wird und in der maximalen Ausbaustufe satte 28 Mrd. Transistoren beinhaltet. Als abgespecktes Derivat gesellt sich der kleinere GA104 hinzu, der aktuell für die GeForce RTX 3070 und die im Dezember 2020 präsentierte GeForce RTX 3060 Ti als Basis dient. Neu hinzugekommen ist außerdem der GA106-Chip, der für die GeForce RTX 3060 Verwendung findet.

Die Flaggschiffe GeForce RTX 3090 und RTX 3080 bedienen sich derweil der GA102-GPU und bilden die Speerspitze des neuerlichen GeForce-Lineups von Nvidia. Die maximale Ausbaustufe von Ampere nutzen diese aber dennoch nicht ‒ mehr dazu in den folgenden Abschnitten. Ganz nebenbei führte Nvidia mit Ampere auch PCI Express der vierten Generation in sein Produktsortiment ein und tut es somit Konkurrent AMD gleich. Seit wenigen Wochen umfasst die GPU-Familie auch zwei neue Ti-Versionen: GeForce RTX 3070 Ti und RTX 3080 Ti. Das neue 3070er-Modell basiert auf dem GA104-400 Chip, bei der 3080 Ti handelt es sich um eine weitere GA102-Variante, nämlich den GA102-225. Ingesamt gehören nun sieben unterschiedlichen Ausführungen zur GeForce-RTX-3000-Familie: RTX 3060 (Ti), RTX 3070 (Ti), RTX 3080 (Ti) sowie RTX 3090.

Grundsätzlich hat Nvidia einige GPU-Begrifflichkeiten und Grundgerüste beibehalten, denn die Chips werden weiterhin in mehrere Graphics Processor Cluster (GPC) unterteilt, die wiederum weitere Einheiten beinhalten. Je GPC bietet ein Ampere-Grafikchip die bekannten Streaming Multiprocessors (SMs), Texture Processing Clusters (TPCs), Geometrieeinheiten und ROPs. In den SMs befinden sich die Recheneinheiten (ALUs) für konventionelle Gleitkomma- und Ganzzahl-Berechnungen (FP32 und INT32), die bezogen auf einen Streaming Multiprocessor gegenüber Turing verdoppelt wurden. D.h. die neuen Chips verfügen über bei gleicher Anzahl SMs über doppelt so viele ALUs für verschiedene Rechenaufgaben. Auch Nvidia selbst sieht die neuen SMs als wichtigen Baustein für den schnellsten und effizientesten Grafikprozessor aus eigener Entwicklung, der damit den doppelten FP32-Durchsatz der vorherigen Generation und bis zu 30 Shader-TFLOPS an Rechenleistung bietet.

Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)

Die Ampere-Architektur ist die zweite GeForce-RTX-Generation (Bildquelle: Nvidia)

Neben den herkömmlichen Rechenknechten in den Ampere-Grafikchips, verspricht Nvidia auch bei den Raytracing-Kernen deutliche Verbesserungen und bezeichnet diese als RT-Kerne der zweiten Generation. Diese neuen, dedizierte RT-Cores liefern den doppelten Durchsatz der vorherigen Generation, plus gleichzeitiges Raytracing sowie Shading und arbeiten mit 58 RT-TFLOPS an Rechenleistung. Ebenso weiterentwickelt wurden die Tensor-Kerne, die in der mittlerweile dritten Generation vorliegen. Die aufpolierten und ebenfalls dedizierten Tensor-Kerne erreichen bis zu doppelten Durchsatz gegenüber der Vorgängergeneration, wodurch KI-gestützte Technologien wie DLSS und 238 Tensor-TFLOPS an Rechenleistung schneller und effizienter ausgeführt werden können. Zwar wurde die Anzahl Tensor-Kerne je SM von acht (Turing) auf vier (Ampere) reduziert, doch stieg gleichzeitig die Leistungsfähigkeit um das Vierfache. Ergebnis soll unterm Strich eine massiv gesteigerte KI-Leistung bei Ampere-GPUs sein.

Technische Daten

Die GeForce RTX 3080 ordnet Nvidia zwischen den beiden jüngsten Modellen GeForce RTX 3070 Ti und GeForce RTX 3080 Ti ein. Dabei darf sich die 3080 über einen GA102-Grafikchip (GA102-200-KD-A1) freuen, der jedoch gegenüber dem Flaggschiff etwas beschnitten wurde. Die 28 Mrd. Transistoren verhelfen dem GeForce-Modell zu 68 Streaming Multiprocessors, was wiederum gleichbedeutend mit in Summe 8.704 ALUs ist („CUDA-Cores“). Zum Vergleich: Das Flaggschiff alias RTX 3090 kann auf insgesamt 10.496 Einheiten zurückgreifen. Die Anzahl der RT-Kerne entspricht 68, die Tensor-Kerne sind mit 272 ebenfalls leicht gegenüber der GeForce RTX 3090 reduziert.

Ergänzt wird diese GeForce-RTX-3000-Variante durch ein 320 Bit breites Speicherinterface zur Anbindung von GDDR6X-Speicher, der mit 10 GB in der Founders Edition eine solide Größe aufweist und daher auch für hohe Auflösungen Potenzial bietet. Dennoch ist die RTX 3090 mit satten 24 GB eine ganz andere Hausnummer und auch die RTX 3080 Ti hat mit 12 GB nochmals zwei GB mehr zu bieten. Im Vergleich mit der Turing-basierten GeForce RTX 2080 Ti muss die neue RTX 3080 auf ein Gigabyte Speicher verzichten, arbeitet bei 760 GB/s aber mit deutlich höherem Speicherdurchsatz als ihre Vorgänger (RTX 2080 Ti: 616 GB/s). Der Vergleich der technischen Daten befindet sich am Ende dieser Seite.

Drei 90-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.

Drei 90-mm-Axial-Lüfter zeichnen sich für die Kühlung der GeForce-GPU verantwortlich.

Die Leistungsaufnahme der Founders Edition gibt Nvidia mit 320 Watt an, was lediglich 30 Watt weniger sind als bei der momentan maximalen Ausbaustufe. Diesen Wert hebt Board-Partner ZOTAC für seine AMP-Holo-Version auf 340 Watt an. Die Karte wird über zwei 8-Pin-PCIe-Anschlüsse mit Leistung versorgt und hat somit 375 Watt zur Verfügung hat (75 Watt PCIe Slot + 2 x 150 Watt 8-Pin Anschluss). Den Boost-Takt hat der Hersteller ab Werk bereits um satte 60 MHz auf 1.770 MHz angehoben (+3,5%), der Speichertakt ist unverändert. Mehr zur Leistungsaufnahme lesen Sie auf Seite 18 des Artikels.

Die Karte belegt 2,5 Slots Bauhöhe und kommt im ausgefallenen HoloBlack-Kühlerdesign.

Die Karte belegt 2,5 Slots Bauhöhe und kommt im ausgefallenen HoloBlack-Kühlerdesign.

Das HoloBlack-Kühlerdesign der AMP-Grafikkarte von ZOTAC ist insgesamt 2,5 Slots hoch und mit einer RGB-LED-Beleuchtung (SPECTRA 2.0 RGB Lighting) versehen. Die Beleuchtung kann mithilfe des FireStorm Utility (Download) personalisiert werden ‒ die Backplate ist mit entsprechenden RGB-LEDs versehen. Die verbesserte IceStorm 2.0 Kühlung basiert auf sieben Kupfer-Heatpipes, die für einen effizienten Wärmetransport zuständig sind. Drei 90-mm-Lüfter mit jeweils elf Lüfterschaufeln erreichen einen bis zu zehn Prozent höheren Luftdurchsatz als die Vorgänger-Generation. Active Fan Control mit FREEZE Fan Stop sorgen dafür, dass die Lüfter stets mit der optimalen Drehzahl drehen und im lastfreien 2D-Betrieb sogar vollständig gestoppt werden. Per FireStorm Utility kann unter anderem auch auf die Lüfterregelung des Boliden Einfluss genommen werden. Mehr zur Temperatur- und Geräuschentwicklung erfahren Sie auf Seite 18 des Tests.

Über zwei integrierte 8-Pin-PCIe-Anschlüsse wird der Bolide mit ausreichend Leistung versorgt.

Über zwei integrierte 8-Pin-PCIe-Anschlüsse wird der Bolide mit ausreichend Leistung versorgt.

Am Slot-Bracket der Karte sind insgesamt drei DisplayPort-Anschlüsse und ein HDMI-Port vorhanden.

Am Slot-Bracket der Karte sind insgesamt drei DisplayPort-Anschlüsse und ein HDMI-Port vorhanden.

NVLink ist bei der GeForce RTX 3080 kein Thema und entsprechend auch nicht an der Grafikkarte zu finden. Hinsichtlich der Anschlussmöglichkeiten für Monitore bietet die neue GeForce RTX 1 x HDMI 2.1 und 3 x DisplayPort 1.4a. Die erhöhte Bandbreite von HDMI 2.1 ermöglicht erstmals eine einzige Kabelverbindung zu 8K-HDR-Fernsehern für Spiele mit ultrahoher Auflösung. Dank Unterstützung für AV1-Decodierung sind die Ampere-Grafikchips die ersten dedizierten GPUs, die es Spielern ermöglichen bis zu 8K-HDR-Internet-Videos bei um bis zu 50 Prozent reduzierter Bandbreite zu sehen.

Folgend die technischen Eckdaten im Vergleich mit GeForce RTX 3080 Ti und RTX 3090.

Hersteller Nvidia
Produktbezeichnung GeForce RTX 3080 GeForce RTX 3080 Ti GeForce RTX 3090
Logo
Architektur Ampere
Grafikchip GA102
Fertigung 8 nm
Transistoren ca. 28,0 Mrd.
CUDA-Cores 8.704 10.240 10.496
Tensor-Cores 272 (3. Gen) 320 (3. Gen) 328 (3. Gen)
Raytracing-Cores 68 (2. Gen) 80 (2. Gen) 82 (2. Gen)
Basistakt 1.440 MHz 1.365 MHz 1.400 MHz
Boosttakt 1.710 MHz 1.665 MHz 1.700 MHz
FP32-Rechenleistung 29.768 GFLOPS 34.099 GFLOPS 35.686 GFLOPS
FP16-Rechenleistung 29.768 GFLOPS 34.099 GFLOPS 35.686 GFLOPS
ROPs 96 112
TMUs 272 320 328
Speichertakt 9.504 MHz 9.752 MHz
Speicherinterface 320 Bit 384 Bit
Speicherbandbreite 760.320 MB/s 912.384 MB/s 936.192 MB/s
Speichermenge 10 GB GDDR6X 12 GB GDDR6X 24 GB GDDR6X
Interface PCIe 4.0
Leistungsaufnahme 320 Watt 350 Watt
Auf der Rückseite befindet sich eine große Backplate mit RGB-LEDs.

Auf der Rückseite befindet sich eine große Backplate mit RGB-LEDs.

Autor: Patrick von Brunn, Stefan Boller
Sapphire NITRO+ RX 7900 GRE im Test
Sapphire NITRO+ RX 7900 GRE im Test
NITRO+ RX 7900 GRE

Mit der AMD Radeon RX 7900 GRE hat eine bisher als OEM-Variante vertriebene GPU nun den offiziellen Weg in den Handel gefallen. Passend zum Marktstart haben wir uns die Sapphire NITRO+ RX 7900 GRE im Test angesehen.

KFA2 GeForce RTX 4080 SUPER SG im Test
KFA2 GeForce RTX 4080 SUPER SG im Test
KFA2 RTX 4080 SUPER SG

Die GeForce RTX 4080 SUPER SG von KFA2 kommt mit 1-Click OC und einer wuchtigen Kühlung im Quad-Slot-Design inkl. RGB-Beleuchtung. Wir haben uns den Boliden im Praxistest ausführlich zur Brust genommen.

ZOTAC RTX 4070 Ti SUPER Trinity Black Test
ZOTAC RTX 4070 Ti SUPER Trinity Black Test
Trinity Black Edition

ZOTAC bietet mit der Trinity Black Edition ein Custom-Design der GeForce RTX 4070 Ti SUPER an, die erst kürzlich von Nvidia vorgestellt wurde. Wie sich die extravagante Grafikkarte im Test schlägt, lesen Sie hier in unserem Review.

INNO3D RTX 4080 SUPER iCHILL Frostbite
INNO3D RTX 4080 SUPER iCHILL Frostbite
INNO3D RTX 4080 SUPER iCHILL Frostbite

Mit der GeForce RTX 4080 SUPER iCHILL Frostbite von INNO3D haben wir heute ein Custom-Design für Systeme mit Wasserkühlung im Test. Der Hersteller arbeitet zu diesem Zweck mit Alphacool zusammen. Mehr in unserem Review.