Informationen zur Load Sharing Facility

Load Sharing Facility auf der SDOME/HPUX/AIX/SOLARIS

Auf den Compute-Servern des Rechenzentrums der RUB ist die Load Sharing Facility (kurz LSF), ein Queueing System zur Verwaltung von Batch-Jobs, installiert. Diese ermöglicht eine einfachere Verwaltung und bessere Ausnutzung der Resourcen der Rechner und der Benutzer-Jobs.

Diese Software steht nach

  • ini lsf

zur Verfügung. Das Load Sharing Batch System (kurz lsbatch) zur Verwaltung von Batch Jobs stellt unter anderem die folgenden Kommandos zur Verfügung:

  • bsub zum Abschicken eines Batch Jobs
  • bmodify um Parameter eines bereits abgeschickten Jobs zu modifizieren
  • bjobs Übersicht über Batch Jobs
  • bqueues Übersicht über Batch Queues
  • bpeek Übersicht über gerade rechnende Batch Jobs
  • bkill schickt das angegebene (UNIX-)Signal an den Batch Job
  • bstop stoppt einen Batch Job

  • lsinfo Information über die zur Verfügung stehenden Resourcen
  • lsload Übersicht über die Lastverteilung

Es gibt zusätzlich die Möglichtkeit, NQS Jobs, d.h. Jobs im NQS-Stil, zu rechnen. Dazu stellt LSF unter anderem folgende Kommandos bereit:

  • qsub zum Abschicken eines NQS Jobs unter LSF
  • qstat Übersicht über die aktuellen Jobklassen
  • qdel löscht einen NQS Job

Weitere Informationen zu den Kommandos liefern die entsprechenden Manual-Pages (Aufruf: man <command>).

Es gibt im Augenblick folgende verschiedene Queues (Jobklassen), in denen der Batch-Auftrag gerechnet werden kann:

  • hp_smst, hp_smmt und hp_smlt (small memory) für HPUX und SDOME,
  • hp_lmst, hp_lmmt und hp_lmlt (large memory) für SDOME
  • ibm_smst, ibm_smmt und ibm_smlt (small memory) für AIX
  • sun_smst, sun_smmt und sun_smlt (small memory) für SOLARIS

Die Jobklassen unterscheiden sich nach der zur Verfügung stehenden Speichergröße und der Rechenzeit.

Eine Übersicht über die aktuelle Konfiguration der Jobklassen erhalten Sie mit dem Kommando bqueues bzw. bqueues -l.

Zurück zur vorherigen Compute-Server-Seite.