WhatsApp

SLURM: un gestore del carico di lavoro progettato per cluster Linux di qualsiasi dimensione

Anonim

Slurm che sta per (Simple Linux Utility For Resource Management)è un gestore di carichi di lavoro e pianificatore di lavori eccezionale, potente, modulare e open source creato per cluster Linux di qualsiasi dimensione. Slurm è un sistema di gestione dei cluster e di pianificazione dei lavori tollerante ai guasti e altamente collegabile con molti plug-in opzionali che è possibile utilizzare. Fornisce la gestione del carico di lavoro su diversi potenti computer e data center in tutto il mondo.

Le principali funzioni di Slurm

Slurm ha tre funzioni principali, prima di tutto assegna l'accesso esclusivo e/o non esclusivo alle risorse agli utenti che vogliono fare un lavoro per un determinato periodo di tempo. Successivamente, Slurm si avvale di un framework che aiuta ad avviare, eseguire e monitorare il lavoro su un insieme di host allocati in un cluster e la sua funzione finale è controllare l'utilizzo delle risorse gestendo una coda di lavoro in sospeso.

Caratteristiche esclusive di Slurm

Puoi trovare molti gestori di carichi di lavoro là fuori, ma Slurm ha molte caratteristiche uniche che lo differenziano da altri gestori di carichi di lavoro e queste caratteristiche includono:

Architettura Slurm

Il sistema Slurm è basato su un gestore centralizzato, slurmctld che monitora diverse risorse e lavoro, e può includere un responsabile del backup per proteggere lo stato del sistema in caso di guasto. Ogni host del cluster ha un demone slurmd che viene confrontato con una shell remota e riceve il lavoro, lo esegue, restituisce lo stato e quindi attende che venga eseguito altro lavoro, il daemon abilita anche la comunicazione tollerante agli errori nella gerarchia della configurazione del sistema. C'è anche un slurmdbd(daemon del database slurm) facoltativo utilizzato per registrare le informazioni di account da diversi cluster gestiti da Slurm in un unico database. Puoi leggere l'architettura completa da qui

Di seguito un'immagine che mostra i diversi componenti del sistema Slurm

Componenti del sistema Slurm

Un'immagine che mostra diverse entità del sistema Slurm

Entità del sistema Slurm

Leggi il cliente testimonianze su Slurm. Potresti voler controllare e provare la gestione dei cluster Slurm e il sistema di pianificazione dei lavori se stai lavorando su cluster Linux di qualsiasi dimensione. Per ulteriori informazioni puoi lasciare qui i tuoi pensieri su Slurm lasciando un commento nella sezione commenti qui sotto.