Nvidia RTX: Die Turing-Architektur im Detail

(Bild: Nvidia)

Nvidia hat alle Details zur Turing-Architektur enthüllt. Die Grafikkarten RTX 2080 Ti, RTX 2080 und RTX 2070 Ti sind ein großer Schritt für das Unternehmen.

Turing: Nvidias nächster großer Schritt

Die neuen Grafikkartenarchitektur von Nvidia ist nun auch offiziell releast. Heute fiel das Embargo für die Turing-Architektur und Unboxings der neuen Grafikkarten. Die RTX 2080 Ti, RTX 2080 und RTX 2070 bringen gemeinsam mit den Quadro-Pendants eine neue Technologie in den Mainstream: Raytracing. Nvidia hat die ganze Architektur quasi nur auf die Strahlenberechnungstechnologie getrimmt. Raytracing ist dabei jedoch bereits quasi ein alter Hut. CGI-Effekte in Film und Fernsehen setzen schon länger auf die Technik. Auch 3D-Simulationen gibt es schon länger mit Raytracing. Bis jetzt war das Feld für die Anwendungen jedoch noch verhältnismäßig klein. Die Hardware dafür war teuer und stromverschwendend.

Das alles ändert sich mit der Turing-Architektur grundlegend. Bereits im April dieses Jahres hat Nvidia eine neue Raytracing-Schnittstelle angekündigt. Dass die Turing-Architektur dann bereits darauf getrimmt sein könnte, ist für den eigentlichen Hauptmarkt – die Gamer – etwas verwunderlich. Das fehlende Teil im Puzzle waren dann die ersten Raytracing-Spiele. Nvidia bringt mit  Turing vor allem Echtzeit-Effekte in Spiele und auch die heimischen Rechner. Das, was vorher nur mit sehr teuren Komponenten und Rechenmonstern möglich war, geht jetzt in Echtzeit und noch dazu mit Consumer-GPUs. Es verwundert nicht wirklich, dass Nvidia ganze zehn Jahre an der Architektur gefeilt hat. Wir liefern einen Überblick, was alles in Turing steckt.

Diese Diashow benötigt JavaScript.

TU102, TU104 und TU106 für RTX-Grafikkarten

Nvidia hat mit Turing gleich für den Anfang drei neue Chips aufgelegt. Der TU102, TU104 und TU106 sind die Chips für alle derzeitigen RTX-Grafikkarten des Herstellers. Die Chips sind im Vergleich mit den Vorgängern geradezu gigantisch. Der TU102 mitts mit 754 mm² fast soviel wie der GV100-Chip der Tesla V100. Der TU104-Chip kommt mit 545 mm², der TU106-Chip mit 445 mm². Der aktuell kleinste Turing-Chip ist damit fast genauso groß wie der GP102-Chip der Pascal-Architektur, welcher in der GTX 1080 Ti eingesetzt wird.

Die neue Architektur kommt zwar in TSMCs 12nm-Fertigungsprozess, hat aber nicht unbedingt eine größere Packdichte als die 16nm-Chips der Vorgänger. Die Anzahl der Transistoren ist deutlich gestiegen. Der TU102 bietet nun 18,6 Milliarden, der TU104 13,6 Milliarden und der TU106 10,9 Milliarden Transistoren. Neu ist auch, dass Nvidia einen eigenen Chip für die RTX 2070 auflegt. Die 70er-Variante hatte sonst immer den gleichen Chip wie die 80er-Variante, jedoch mit deaktivierten Kernen. Bei der RTX 2070 ist dies erstmals anders. Diese beinhaltet den TU106-Chip, während die RTX 2080 den TU104-Chip eingebaut hat. Die RTX 2080 Ti kommt mit der größten Ausbaustufe TU102. Die Grafikkarten haben damit zwar die gleichen Chips wie die Quadro RTX-Pendants, erhalten jedoch trotzdem nicht den Vollausbau. Nvidia will damit wohl die eigenen Quadro-Grafikkarten von den Spielerkarten etwas absetzen.

Tensor- und RT-Cores brauchen Platz

Die große Chipgröße ist auch durch die neu verbauten Kerne in den RTX-Grafikkarten zu erklären. So gibt es neben den normalen Shadern auch Tensor- und RT-Kerne. Die meisten Kerne sind zwar noch immer die CUDA-Kerne, trotzdem sind die verbauten Tensor- und RT-Cores ein wichtiger Bestandteil, die Raytracing überhaupt erst erlauben. So sind auf dem TU102-Chip neben 4.608 Shader-Kernen 576 Tensor- und 72 RT-Kerne verbaut. Die Kerne sind in sogenannten Streaming Multiprozessoren, kurz SMs, miteinander verschaltet. Pro SM gibt es 64 Shader, acht Tensor- und einen RT-Kern. Nvidia dreht bei der Gaming-Variante RTX 2080 Ti vier dieser SMs ab. Die Grafikkarte erhält somit einen etwas beschnittenen TU102-Chip mit 4.352 CUDA-Kernen, 544 Tensor- und 68 RT-Kernen.

Ähnlich ist es auch beim TU104 Während der Vollausbau beim TU104 bei 3.072 Shadern, 384 Tensor-Kernen und 48 RT-Kernen liegt, bekommt die RTX 2080 davon nur 2.944 Shader, 365 Tensor- und 46 RT-Kerne. Lediglich die TU106 kommt im vollaktivierten Umfang auch in die Gaming-Ableger. So erhält die RTX 2070 die vollen 2.304 Shader, 288 Tensor- und 36 Raytracing-Kerne.

 TU102 vollTU102 teilTU104 vollTU104 teilTU106
Die-Größe754 mm²754 mm²545 mm²545 mm²445 mm²
SMs7268484636
Shader4.6083.0722.304
TMUs288192144
ROPs966464
Tensor-Kerne576384288
RT-Kerne7268484636
L2-Cache6 MByte6 MByte4 MByte4 MByte4 MByte
Speicherinterface384 Bit256 Bit256 Bit256 Bit256 Bit

Neue Shader 50 Prozent schneller

Während die Tensor- und RT-Kerne für Spieler noch eher uninteressant sind, sind es die Shader umso mehr. So verbaut Nvidia nicht nur wieder deutlich mehr Shader pro Grafikkarte, sondern hat die Leistung dieser auch noch gesteigert. Je nach Workload sollen die Shader so um bis zu 50 Prozent schneller rechnen können. Das soll vor allem durch die neue SM-Struktur von weniger Kernen pro SM und dafür mehr SMs generell und neue FP32-Einheiten möglich sein. Auch ein verbesserter Cache soll die Leistung jedes einzelnen Kerns verbessern.

Pro SM kommen bei Turing nun auch die Tensor- und RT-Kerne hinzu. Pro SM gibt es acht Tensor- und einen RT-Kern. Beide spielen vor allem für Raytracing und AI eine wichtige Rolle. Durch die dedizierten Einheiten entlasten die speziell auf diese Anwendungen ausgelegten Kerne die gewöhnlichen Shader. So beträgt die Raytracing-Leistung der GTX 1080 Ti nur 1,1 Gigarays/s, während der TU102-Chip 10 Gigarays/s schafft.

Was bedeutet das für Gamer?

Turing ist in vielen Facetten deutlich besser geworden, legt den Fokus jedoch trotzdem auf Raytracing. Die Technologie steckt für Games verhältnismäßig jedoch noch in den Kinderschuhen. Bis die Hardware noch besser wird und Raytracing komplett ausgereift ist, dürften noch einige Jahre vergehen. Nvidia hat trotzdem auf beeindruckende Weise gezeigt, was technisch möglich ist. Dabei sind auch die Änderungen am internen Layout und den Shadern nicht zu kurz gekommen. Durch schnellere Shader, schnelleren Speicher und eine Optimierung der SMs wird auch für Gamer Turing eine gute Leistungssteigerung bieten. Wie hoch diese ausfällt, sollte man jedoch auf jeden Fall abwarten. In fünf Tagen wissen wir mehr. Dann wissen wir auch, ob sich die hohen Preise auszahlen.

Über Florian Maislinger 1222 Artikel
Florian Maislinger ist Autor und Gründer von PC Builder's Club. Als gelernter IT-Engineer ist er bestens mit Computern und Hardware vertraut und seit Kindesbeinen an ein Technikliebhaber wie er im Buche steht. Er ist hauptsächlich für die News und unsere Social Media-Kanäle verantwortlich.

Hinterlasse jetzt einen Kommentar

Kommentar hinterlassen

E-Mail Adresse wird nicht veröffentlicht.


*