Ponte Vecchio, der Intel XE GPU-Beschleuniger für Supercomputer im Exascale-Bereich

Ponte Vecchio, der Intel XE GPU-Beschleuniger für Supercomputer im Exascale-Bereich

Ende 2017 gab Intel seine Absicht bekannt, in die Welt der dedizierten GPUs zurückzukehren. Raja Koduri, ehemaliger Leiter der AMD Radeon Technologies Group, übergibt die Schlüssel für den gesamten Betrieb. Koduri, seitdem Chefarchitekt von Intel und Senior Vice President der neuen Core and Visual Computing Group, hat in den letzten Jahren an der so genannten Xe-Architektur gearbeitet, einem Projekt, das von ultramobilen Computern bis hin zu Supercomputern und Schulungen skaliert werden kann künstlicher Intelligenz, die alle ein einziges Programmiermodell verwenden.

Intel ist noch nicht bereit, im Detail zu diskutieren, wie die Xe-Architektur auf alle Marktsegmente angewendet werden soll. In diesen Stunden wurden jedoch die ersten Informationen zu "Ponte Vecchio" veröffentlicht, dem ersten Beschleuniger der Exascale-Klasse, der im Jahr 2021 eingeführt wurde HPC-Sektor, der von Supercomputern. Ponte Vecchio als eines der Wahrzeichen der Stadt Florenz, die charakteristische Brücke, die den Fluss Arno überquert.

Intel Ponte Vecchio zeichnet sich durch drei charakteristische "Hardware" -Funktionen aus: die Verwendung des 7-Nanometer-Herstellungsverfahrens für die Realisierung der Chips, die Foveros- und EMIB-Verpackungstechnologien und die Xe-Link-Verbindung (basierend auf dem CXL-Standard – Compute Express Link – wiederum abgeleitet von PCIe 5.0) für die angeschlossene GPU.

Wenn wir uns der Xe-Architektur zuwenden, finden wir zumindest in dieser Inkarnation eine flexible datenparallele Vektormatrix-Engine, die für Operationen mit künstlicher Intelligenz von entscheidender Bedeutung ist. Xe gewährleistet auch einen hohen Durchsatz mit Double-Precision-Gleitkommaberechnungen (FP64), eine wichtige Anforderung nicht für die KI-Umgebung, sondern für herkömmliche Lasten wie Wettersimulationen, Forschung mit fossilen Brennstoffen usw. Schließlich eine hohe Menge an Speicher-Cache und Bandbreite (wahrscheinlich dank der Verwendung von HBM-Speicher), die je nach Folie direkt mit den einzelnen Berechnungs-Chiplets verbunden werden.

Wir werden Ponte Vecchio an Bord des Aurora-Supercomputers sehen, der 2021 im Argonne National Laboratory installiert wird, aber auch in HPCs, die von Atos und Lenovo entwickelt wurden. Es wird ein Exascale-System sein, das mindestens eine exFLFL von Berechnungen pro Sekunde ausführen kann (eine Milliarde Operationen pro Sekunde).

In einem einzigen Aurora-Knoten befinden sich zwei Xeon-skalierbare CPUs "Sapphire Rapids" (10-Eis-Nanometer-Architektur nach Ice Lake) und sechs Ponte Vecchio-GPUs, die durch eine einheitliche Speicherarchitektur und eine Konnektivität kombiniert werden, die niedrige Latenz und hohe Bandbreite gewährleisten. Insgesamt sprechen wir von über 10 Petabyte Speicher, 230 Petabyte Speicher und über 200 Racks.

Dank OneAPI, einem einheitlichen Programmiermodell, das auf Industriestandards und offenen Spezifikationen basiert und die Entwicklung zwischen verschiedenen Architekturen vereinfacht, wird alles zusammenarbeiten. Benutzerfreundlichkeit und Leistung, aber auch die Abkehr von verschiedenen Basiscodes und Programmiersprachen sowie verschiedenen Tools und Workflows.

Insbesondere enthält One API eine neue direkte und offene Programmiersprache, Data Parallel C ++ (DPC ++). Es basiert auf C ++, enthält SYCL der Kronos Group und Erweiterungen, die in einem offenen Prozess mit der Community entwickelt wurden.

Eine mutige und ehrgeizige Entscheidung von Intel, die jedoch beinahe ein obligatorischer Weg zu sein scheint, da sie im Gegensatz zu anderen Unternehmen eine Strategie verfolgt, die auf mehreren Produkten basiert, insbesondere in der Welt der künstlichen Intelligenz: CPU, GPU, FPGA und Spezialbeschleuniger. Alles wird von der Firma xPU definiert.

Das Unternehmen hat OneAPI auf Intel DevCloud verfügbar gemacht, einer Entwicklungs-Sandbox zum Optimieren, Testen und Durchführen verschiedener Workloads auf CPUs, GPUs und FPGAs. Ziel ist es, Entwicklern die Möglichkeit zu geben, sich mit OneAPI vertraut zu machen. Schließlich hat Intel ein Migrationstool entwickelt, das CUDA-Code in OneAPI konvertiert. Dies ist ein klarer Versuch, mit der Programmiersprache von Nvidia zu konkurrieren.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.