NEWS / Nvidia vereinfacht mit CUDA 6 parallele Programmierung

14.11.2013 18:15 Uhr    Kommentare

Nvidia stellt heute mit CUDA 6 eine neue Version der parallelen Computing-Plattform vor. CUDA 6 macht parallele Programmierung einfacher als je zuvor. Software-Entwickler können mit ihr maßgeblich den notwendigen Aufwand und die erforderliche Zeit für die Beschleunigung von wissenschaftlichen und konstruktionstechnischen Anwendungen, Enterprise-Applikationen sowie sonstigen Anwendungen für GPUs reduzieren. Durch die Verbesserungen in CUDA 6 können Entwickler Applikationen umgehend um den Faktor 8 beschleunigen, indem sie einfach die vorhandenen CPU-basierten Libraries ersetzen, so Nvidia heute.

Schlüsselfunktionen von CUDA 6 sind:

  • Unified Memory – Vereinfacht die Programmierung, da Applikationen Zugriff auf den Speicher von CPU und GPU erhalten, ohne manuell Daten jeweils hin und her kopieren zu müssen. Dadurch wird auch die Unterstützung von GPU-Beschleunigung in vielen Programmiersprachen vereinfacht.
  • Drop-in Libraries – Beschleunigen automatisch die BLAS- und FFTW-Berechnungen in Applikationen um bis zu 8X durch den Austausch der vorhandenen CPU-Libraries durch die GPU-Varianten.
  • Multi-GPU Scaling – Neu angelegte BLAS- und FFT-GPU-Libraries skalieren automatisch über bis zu acht GPUs in einem Single Node und liefern über neun Teraflops Double-Precision-Leistung pro Node. Es werden größere Workloads als je zuvor unterstützt (bis zu 512GB). Multi-GPU Scaling lässt sich auch mit der neuen BLAS Drop-in Library nutzen.

Zusätzlich zu den neuen Funktionen bietet die CUDA-6-Plattform eine komplette Suite mit Programmier-Tools, GPU-beschleunigten Mathematik-Libraries, Dokumentationen und Programmier-Anleitungen. Die Version 6 des CUDA-Toolkits wird voraussichtlich Anfang 2014 verfügbar sein. Mitglieder des CUDA Computing Registered Developer Program erhalten automatisch eine Nachricht, sobald der Download bereitsteht. Wer am Developer Program teilnehmen möchte, kann sich bei Nvidia registrieren.

Weitere Informationen zur CUDA-6-Plattform gibt es auf der SC13 in Denver vom 18. bis 21. November am Nvidia-Stand 613 und auf der CUDA-Webseite.

Quelle: Nvidia PR – 14.11.2013, Autor: Patrick von Brunn
INNO3D GeForce RTX 5080 X3 OC im Test
INNO3D GeForce RTX 5080 X3 OC im Test
INNO3D RTX 5080 X3 OC

Mit der GeForce RTX 5080 X3 OC von INNO3D haben wir ein weiteres Custom-Design auf Basis der neuen Blackwell-Architektur im Testlab empfangen. Mehr zum Praxistest des Boliden in unserem Artikel.

Samsung EVO Plus (2024) microSDXC 1 TB
Samsung EVO Plus (2024) microSDXC 1 TB
Samsung EVO Plus (2024), 1 TB

Die neue 2024er-Version der EVO Plus microSDXC-Speicherkarte von Samsung ist mit bis zu 1 TB erhältlich und bietet 160 MB/s lesend, statt 130 MB/s wie beim Vorgänger aus 2021. Mehr dazu im Test.

Blackwell: KFA2 RTX 5080 1-Click OC im Test
Blackwell: KFA2 RTX 5080 1-Click OC im Test
KFA2 RTX 5080 1-Click OC

Nachdem wir vor ein paar Tagen und pünktlich zur Marktverfügbarkeit die RTX 5080 1-Click OC von KFA2 angetestet haben, folgt nun der gewohnt ausführliche Review des Blackwell-Boliden.

Klanglicher Aufstieg: Nubert nuPro XS-4000 RC
Klanglicher Aufstieg: Nubert nuPro XS-4000 RC
Nubert nuPro XS-4000 RC

Die Nubert nuPro XS-4000 RC sind nicht nur für die Verwendung am Computer geeignet, sondern kommen auch mit HDMI ARC, Bluetooth und Fernbedienung.