Wiki » History » Version 123

« Previous - Version 123/169 (diff) - Next » - Current version
Gueguen Mikael, 03/21/2016 01:54 PM


Mésocentre SPIN Calcul

Introduction/Les calculateurs

2 machines de calcul de marque SGI sont disponibles pour des usages différents :

Chaque calculateur dispose de PBSpro avec des files et des usages définis spécifiquement. Ils disposent aussi d'outils et librairies de calcul spécifiques performants proposés par le constructeur (mpt,perfboost,MPInside, blcr).

assistance

PBS

introduction

création de script de soumission, soumission et suivi

codes de retour suite à l'arrêt d'un calcul

exemples de scripts


Machine de calcul MPI, THOR

La machine de calcul Thor est un cluster MPI SGI ICE-X de 2300 coeurs. Il est composé de 115 lames de calcul bi-socket Intel(R) Xeon(R) CPU E5-2680 v2 @ 2.80GHz (20 coeurs par lames) avec 32 Go de mémoire par socket soit 3.2 Go par coeurs.

Chaque lame est raccordée à un réseau Infiniband hypercube enhanced FDR à 56 Gbit/s. Le stockage des données de calcul est basé sur un système de fichier parallèle Lustre 2.5 via le réseau Infiniband. Il offre une capacité de 56 To pour le répertoire /scratch et de 21 To pour le répertoire /home.

vue thor architecture

La connexion à la machine se fait à l'adresse thor.univ-poitiers.fr par ssh sur le port 86 :

ssh -p 86 -X homer@thor.univ-poitiers.fr

monitoring : http://thor-ganglia.univ-poitiers.fr

Documentations à télécharger

librairies MPI

Compilateurs

Profilage de code MPI

Codes installés

Les codes installées sont à utilisés avec l'utilitaire module pour le chargement adhoc des variables d'environnement :

[homer@thor ~]$ module avail codes

------------------------------------------------------- /sw/Modules/modulefiles -------------------------------------------------------
codes/abinit/7.10.1   codes/lammps/2013     codes/saturne/3.2.1   codes/vasp/5.3/kpar   codes/wien2k/2014
codes/espresso/5.1.1  codes/openfoam/2.3.1  codes/vasp/5.3/gamma  codes/vasp/5.3/noncol codes/zebulon/Z8.6

librairies installés

les librairies dynamiques possèdent généralement un module associé afin de charger correctement l'environnement :

[homer@thor ~]$ module avail lib
------------------------------------------------------- /sw/Modules/modulefiles -------------------------------------------------------
lib/boost/1.55      lib/fftw/3.3.4      lib/mumps/4.10.0    lib/parmetis/4.0.3  lib/petsc/3.5.2-opt
lib/cgns/3.1.4      lib/metis/5.1.0     lib/mumps/5.0.0     lib/petsc/3.4.3-opt lib/vtk/5.10.1

  • VTK visualization toolkit
  • BOOST librairie c++
  • PETSc librairie de calcul parallèle
  • blcr utilitaire pour faire du Checkpoint / Restart
  • perfboost utilitaire pour améliorer les performances d'un code MPI non compilé avec la librairie MPT de SGI

utilitaires

Système de fichier LUSTRE

Commandes

espace disque

  • Connaitre l'espace utilisé sur un répertoire
    [homer@thor]$ du -sh
    376K    .
    

commandes propres à thor

ces scripts sont localisés sous /sw/tools/bin. Pour les utiliser ajouter ce chemin au PATH dans votre .bashrc

PATH=$PATH:/sw/tools/bin

  • qmem : permet de tracer l'utilisation mémoire d'un job
    [gueguenm@thor 5cycl]$ qmem --job=339337
    Memory Usage for job : 339337
    -------------------------------
    -> ncpu per host requested : 20
    -> number of host requested : 4
    user : tnakano,JID : 339337,
    host : r1i7n0 r1i7n1 r1i7n2 r1i7n3
        -> r1i7n0 : RAM mem = 14.2385063171387     (GB) ; TOT mem = 19.9174461364746 (GB)
        -> nb user pid : 24
        -> r1i7n1 : RAM mem = 13.5929222106934     (GB) ; TOT mem = 24.9528999328613 (GB)
        -> nb user pid : 24
        -> r1i7n2 : RAM mem = 14.2325859069824     (GB) ; TOT mem = 25.5949440002441 (GB)
        -> nb user pid : 24
        -> r1i7n3 : RAM mem = 13.8947525024414     (GB) ; TOT mem = 25.2552146911621 (GB)
        -> nb user pid : 24
    
    
  • gload : charge machine donnée par l'outil de monitoring ganglia
    [homer@thor]$ gload
            total cpus available  : 2460
            total used nodes      : 110
            total used process    : 1969
            1mn load on thor      : 78.9272357723577 %
            idle load on thor     : 20.4073170731707 %
    
    
  • showq, pestat, ustat : commandes supplémentaires pbs
  • pbsn : liste les noeuds et leurs états (down, job-exclusive, free)
  • connaitre les noeuds libres :
    [homer@thor]$ pbsn |grep free
    r1i4n11    free    65000000kb    20
    r1i4n15    free    65000000kb    20
    r1i5n13    free    65000000kb    20
    r1i7n9    free    65000000kb    20
    
  • compte le nombre de noeuds utilisés
    [homer@thor ~]$ pbsn | grep job | wc -l
    31
    
  • running_job_end renvoi le nombre de jours restants des calculs en run
[homer@thor ~]$ running_job_end
       JID                user               date
----------------------------------------------------
   226217.thor           dmagne       24 days, 23:50:00
   226279.thor           dmagne       24 days, 23:50:00
   226280.thor           dmagne       24 days, 23:50:00
 ...

archi_thor.png - architecture (356 KB) Gueguen Mikael, 05/22/2015 03:27 PM

thor.jpg (519 KB) Gueguen Mikael, 05/22/2015 03:28 PM

IMG_1361.JPG - vue thor (103 KB) Gueguen Mikael, 09/01/2015 11:17 AM

initiation_linux_15-03-2021.pdf (4.61 MB) Laplaceta Pierre Francois, 03/15/2021 04:39 PM