NEWS / Nvidia vereinfacht mit CUDA 6 parallele Programmierung

14.11.2013 18:15 Uhr    Kommentare

Nvidia stellt heute mit CUDA 6 eine neue Version der parallelen Computing-Plattform vor. CUDA 6 macht parallele Programmierung einfacher als je zuvor. Software-Entwickler können mit ihr maßgeblich den notwendigen Aufwand und die erforderliche Zeit für die Beschleunigung von wissenschaftlichen und konstruktionstechnischen Anwendungen, Enterprise-Applikationen sowie sonstigen Anwendungen für GPUs reduzieren. Durch die Verbesserungen in CUDA 6 können Entwickler Applikationen umgehend um den Faktor 8 beschleunigen, indem sie einfach die vorhandenen CPU-basierten Libraries ersetzen, so Nvidia heute.

Schlüsselfunktionen von CUDA 6 sind:

  • Unified Memory – Vereinfacht die Programmierung, da Applikationen Zugriff auf den Speicher von CPU und GPU erhalten, ohne manuell Daten jeweils hin und her kopieren zu müssen. Dadurch wird auch die Unterstützung von GPU-Beschleunigung in vielen Programmiersprachen vereinfacht.
  • Drop-in Libraries – Beschleunigen automatisch die BLAS- und FFTW-Berechnungen in Applikationen um bis zu 8X durch den Austausch der vorhandenen CPU-Libraries durch die GPU-Varianten.
  • Multi-GPU Scaling – Neu angelegte BLAS- und FFT-GPU-Libraries skalieren automatisch über bis zu acht GPUs in einem Single Node und liefern über neun Teraflops Double-Precision-Leistung pro Node. Es werden größere Workloads als je zuvor unterstützt (bis zu 512GB). Multi-GPU Scaling lässt sich auch mit der neuen BLAS Drop-in Library nutzen.

Zusätzlich zu den neuen Funktionen bietet die CUDA-6-Plattform eine komplette Suite mit Programmier-Tools, GPU-beschleunigten Mathematik-Libraries, Dokumentationen und Programmier-Anleitungen. Die Version 6 des CUDA-Toolkits wird voraussichtlich Anfang 2014 verfügbar sein. Mitglieder des CUDA Computing Registered Developer Program erhalten automatisch eine Nachricht, sobald der Download bereitsteht. Wer am Developer Program teilnehmen möchte, kann sich bei Nvidia registrieren.

Weitere Informationen zur CUDA-6-Plattform gibt es auf der SC13 in Denver vom 18. bis 21. November am Nvidia-Stand 613 und auf der CUDA-Webseite.

Quelle: Nvidia PR – 14.11.2013, Autor: Patrick von Brunn
ASUS ROG Strix GeForce RTX 4090 OC im Test
ASUS ROG Strix GeForce RTX 4090 OC im Test
ASUS ROG Strix RTX 4090 OC

Mit der ROG Strix RTX 4090 bietet ASUS eine ab Werk übertaktete GeForce an, die mithilfe einer wuchtigen Quad-Slot-Kühlung eine überragende Kühlleistung bietet. Wir haben den Boliden in der Praxis ausgiebig begutachtet.

3D V-Cache: AMD Ryzen 9 7950X3D im Test
3D V-Cache: AMD Ryzen 9 7950X3D im Test
AMD Ryzen 9 7950X3D

Mit dem Ryzen 9 7950X3D von AMD haben wir heute eine Zen 4-CPU mit satten 16 Kernen und 3D V-Cache Technologie im Test. Besonders im Bereich Gaming verspricht AMD eine hohe Performance.

Toshiba MG11ACA HDD mit 24 TB im Test
Toshiba MG11ACA HDD mit 24 TB im Test
Toshiba MG11ACA 24 TB

Mit der Cloud-Scale Capacity MG11ACA24TE stellte Toshiba erst kürzlich seine neue Enterprise-Festplatte mit satten 24 TB vor. Diese HDD ist das erste Modell der Familie mit 1 GB Puffer. Mehr dazu im Test.

Kingston FURY RENEGADE SSD 2 TB Review
Kingston FURY RENEGADE SSD 2 TB Review
FURY RENEGADE SSD, 2 TB

Die FURY RENEGADE ist eine SSD-Familie von Kingston, basierend auf einem PCI Gen4 Interface und Phison-Controller. Wir haben uns das Modell ohne Kühlkörper und mit 2 TB Speicherkapazität im Test ganz genau angesehen.