Kurzfassung
|
Führende Supercomputer im Bereich des High Performance Computing (HPC) bieten immense Rechenleistung mit Millionen von Kernen. Allerdings kostet der Unterhalt und Energiebedarf solcher Systeme jedes Jahr Millionen von Euro. Dies macht eine effiziente Nutzung der Rechenressourcen von HPC-Systemen unabdingbar. Das von den meisten HPC-Anwendungen verwendete Bulk-Synchronous-Parallel-Modell könnte aber durch unvorhergesehene interne oder externe Einflüsse zu ungleich verteilter Arbeitslast führen. Verwandte Forschung in diesem Bereich berücksichtigt oft nur die sogenannte Load Imbalance auf eine Weise, die keinen Vergleich zwischen MPI-Ranks ermöglicht. Unser Ansatz zielt hingegen darauf ab, einen breiteren Satz von Metriken zu betrachten, um eine allgemeinere Bewertung der Load-Imbalance zu ermöglichen. Unser Beitrag ermöglicht ein besseres Verständnis der Ursachen von Ineffizienzen in HPC-Anwendungen.
|