Terminologi

Terminologi berikut sering digunakan saat menggunakan AI Hypercomputer.

Block
Kumpulan sub-blok yang saling terhubung dengan fabric non-blok, yang menyediakan konektivitas berbandwidth tinggi di antara semua host.

Cluster
Kumpulan blok yang saling terhubung oleh fabric jaringan berkecepatan tinggi. Setiap cluster bersifat unik secara global. Untuk mesin A4X, A4, A3 Ultra, A3 Mega, dan A3 High (8 GPU), cluster menyediakan fabric jaringan non-blok umum untuk blok kapasitas akselerator Anda. Dalam cluster, jaringan timur ke barat tidak diblokir untuk seluruh kumpulan blok.

Dense deployment
Permintaan resource yang mengalokasikan resource akselerator Anda secara fisik berdekatan satu sama lain untuk meminimalkan hop jaringan dan mengoptimalkan latensi terendah.

Network fabric
Fabric jaringan menyediakan konektivitas berbandwidth tinggi dan latensi rendah di semua blok dan Google Cloud layanan dalam cluster. Jupiter adalah arsitektur jaringan pusat data Google yang menggunakan software-defined networking dan switch sirkuit optik untuk mengembangkan jaringan dan mengoptimalkan performanya.

Node or host
Satu mesin server fisik di pusat data. Setiap host memiliki resource komputasi terkait, seperti akselerator. Jumlah dan konfigurasi resource komputasi ini bergantung pada kelompok mesin. Instance Compute Engine disediakan di atas host fisik.

Domain NVLink, yang juga disebut sebagai sub-blok, adalah unit kapasitas inti untuk mesin A4X Max dan A4X. Domain NVLink terdiri dari 18 instance A4X Max atau A4X (72 GPU) yang terhubung oleh sistem NVLink multi-node.

Sub-block
Sekelompok host dan hardware konektivitas terkait yang berada di satu rak fisik. Dalam konteks mesin A4X Max dan A4X, sub-blok juga disebut sebagai domain NVLink.

Informasi selengkapnya

Dokumen berikut memberikan penjelasan lebih lanjut tentang terminologi yang relevan dengan topik terkait: