Structure / Interdisciplinary Center for Computer Simulations / User Guide
User Guide
Connection
Connection to the ICCS computing cluster is provided via the SSH protocol with two-factor authentication (2FA) through the server west3.icmp.lviv.ua, which serves as the cluster master node.
Access is granted only to authorised users after registration and approval of their user account. When connecting to the cluster, users must complete the standard authentication procedure, which includes:
-
entering their username and password;
-
confirming the login using a one-time password (OTP).
Slurm Workload Manager
The ICCS computing cluster uses SLURM - the Slurm Workload Manager - to manage computational jobs.
(Simple Linux Utility for Resource Management, https://slurm.schedmd.com).
Slurm provides:
-
allocation of computing resources among users;
-
job scheduling and execution through queues;
-
control of CPU, GPU, and memory usage;
-
monitoring of job status and the state of cluster nodes.
All computational jobs must be submitted and executed exclusively through Slurm. Direct execution of programs on compute nodes or on the head node is prohibited.
Users may:
-
подавати задачі до черги за допомогою команд
sbatchабоsrun; -
переглядати стан задач за допомогою
squeue; -
отримувати інформацію про доступні ресурси (
sinfo); -
завершувати або скасовувати задачі (
scancel)
Для коректної та ефективної роботи з кластером рекомендується:
-
коректно вказувати запитувані ресурси (кількість CPU, обсяг пам’яті, GPU);
-
використовувати файли сценаріїв (
job scripts) для запуску довготривалих задач; -
уникати перевикористання ресурсів і запуску надмірної кількості задач;
-
регулярно перевіряти статус своїх задач.
Збереження даних
Користувачам обчислювального кластера МЦКМ надається дисковий простір для збереження результатів обчислень та проміжних даних у директорії /scratch/users.
Каталог /scratch/users/ призначений для тимчасового зберігання даних, отриманих у процесі виконання обчислювальних задач.
Рекомендується:
-
зберігайти у каталозі
/scratch/users/лише дані, пов’язані з активними обчисленнями; -
регулярно переносити важливі результати до довготривалих сховищ;
-
не використовувати
/scratchдля постійного зберігання даних або резервних копій; -
дані, що не використовуються протягом тривалого часу, можуть бути автоматично видалені.
Програмне забезпечення та модульне середовище
На обчислювальному кластері МЦКМ використовується модульна система керування програмним забезпеченням (Environment Modules), яка дозволяє гнучко налаштовувати програмне середовище користувача без конфліктів між різними версіями бібліотек і компіляторів.
Для перегляду доступних програмних модулів використовується команда module avail, а для завантаження відповідних модулів module load [module name].
Модульне середовище включає:
-
компілятори (GNU Compiler Collection, i.e.
gcc,g++,gfortan), -
MPI-реалізації (OpenMPI),
-
GPU-інструменти (CUDA),
-
математичні бібліотеки (GSL, OpenBLAS, ScaLAPACK, FFTW, PETSc, Trilinos тощо),
-
засоби збірки та керування ПЗ (CMake, EasyBuild, Spack),
-
різноманітні бібілотеки та утиліти,
-
програмні пакети для моделювання (GROMACS, LAMMPS тощо).
Детальніша інформація щодо користування кластером МЦКМ надається групою Підтримки кластера.