Wiki » History » Version 26

« Previous - Version 26/169 (diff) - Next » - Current version
Gueguen Mikael, 05/22/2015 02:23 PM


Mésocentre SPIN Calcul

Machine de calcul MPI, THOR

La machine de calcul Thor est un cluster MPI SGI ICE-X de 2300 coeurs. Il est composé de 115 lames de calcul bi-socket Intel(R) Xeon(R) CPU E5-2680 v2 @ 2.80GHz (20 coeurs par lames) avec 32 Go de mémoire par socket soit 3.2 Go par coeurs.

Chaque lame est raccordée à un réseau Infiniband hypercube enhanced FDR à 56 Gbit/s. Le stockage des données de calcul est basé sur un système de fichier parallèle Lustre 2.5 via le réseau Infiniband. Il offre une capacité de 56 To pour le répertoire /scratch et de 21 To pour le répertoire /home.

La connexion à la machine se fait à l'adresse thor.univ-poitiers.fr par ssh sur le port 86 :

ssh -p 86 -X homer@thor.univ-poitiers.fr

monitoring : http://thor-ganglia.univ-poitiers.fr

PBS

principales directives de PBS

Les ressources nécessaires au calcul sont définies dans le script de soumission via des directives PBS (lignes de script precèdés de #PBS).
Les directives PBS permettent de :
  • preciser le shell qui doit interpreter le script de soumission
#PBS -S /bin/bash
  • définir le nom du job soumis
#PBS -N nomJob
  • definir la sortie standard (stdout) du job
#PBS -o outputJob.txt
  • definir la sortie erreur standard (stderr) du job
#PBS -e errorJob.txt
  • rediriger la sortie erreur dans la sortie standard
#PBS -j oe
  • spécifier la queue sur laquelle le job va être dirigé
#PBS -q default 

Remarques :
- la queue de routage est default
- elle accède aux queues de soumission (* small, normal, medium, large * ) suivant les ressources demandées

  • spécifier le temps maximal d'execution souhaite
#PBS -l walltime=hh:mm:ss
  • recevoir un mail à differente etape du job
#PBS -m abe -M homer.simpson@springfield.us

Les parametres de l'option m sont :
a : envoi d'un mail en cas d'arrêt du job avant la fin de l'execution normal
- b : envoi d'un mail en debut de job
- e : envoi d'un mail en fin de job

codes de retour suite à l'arrêt d'un calcul

Documentations à télécharger

Codes installés

librairies installés

  • VTK
  • BOOST
  • blcr utilitaire pour faire du Checkpoint / Restart
  • perfboost utilitaire pour améliorer les performances d'un code MPI non compilé avec la librairie MPT de SGI

archi_thor.png - architecture (356 KB) Gueguen Mikael, 05/22/2015 03:27 PM

thor.jpg (519 KB) Gueguen Mikael, 05/22/2015 03:28 PM

IMG_1361.JPG - vue thor (103 KB) Gueguen Mikael, 09/01/2015 11:17 AM

initiation_linux_15-03-2021.pdf (4.61 MB) Laplaceta Pierre Francois, 03/15/2021 04:39 PM