Context Navigation

Changes between Version 1 and Version 2 of tutopathenaanalysis

Timestamp:: 18/11/2008 11:14:02 (16 years ago)
Author:: /O=GRID-FR/C=FR/O=CNRS/OU=LPSC/CN=Fabian Lambert
Comment:: --

Legend:

: Unmodified
: Added
: Removed
: Modified

tutopathenaanalysis

-              v1
+              v2
   * [wiki:setupAthenaLocal Préparer votre environnement] comme pour un job à lancer en local (cmthome, testarea...)
   * [wiki:setuppathena Installez et configurez l'outil de soumission de job pathena.]
+  * Décompressez le package fourni sous testarea puis initialiser le (après l'avoir éventuellement compilé)
+ == Le fichier joboptions ==
  {{{
+sh-3.00$ gmake
+sh-3.00$ cd /atlas/lambert/testarea/14.2.21/SingleTopDPDMaker/run
+sh-3.00$ ls
+dashboard.log            gangascript.py   log_debug            PoolFileCatalog.xml.BAK       SingleTopD3PD.root
+exeSingleTopDPDMaker.py  log_athena_test  PoolFileCatalog.xml  runSingleTopDPDMaker_FDR2.py
 }}}
+ ==== Le fichier joboptions ====
+ {{{
+sh-3.00$ cd testarea/14.2.20/TopAnalysis/run/
+}}}
+ Placez vous dans le répertoire run. Vous devez y trouver les fichiers joboptions !RunTopAnalysisDPD.py et !TopAnalysisDPD.py [[BR]]
+ Placez vous dans le répertoire run. Vous devez y trouver les fichiers joboptions runSingleTopDPDMaker_FDR2.py et exeSingleTopDPDMaker.py [[BR]]
  Vous n'avez rien à modifier, pathena analyse vos job options automatiquement.
+ ==== Initialisation de l'environnement d'exécution dans pathena ====
+ == Initialisation de l'environnement d'exécution dans pathena ==
+ Une fois votre package pathena obtenu de CVS et compilé, vous n'avez plus qu'à faire un source du fichier setup.sh.[[BR]]
+ Bien sûr vous devez auparavant initialiser l'environnement athena (voir prérequis)
 {{{
 sh-3.00$ ganga
+sh-3.00$ source /swareas/atls/prod/releases/rel_14-5/CMT/v1r20p20080222/mgr/setup.sh
+sh-3.00$ source ~/cmthome/setup.sh -tag=14.2.21,setup
+sh-3.00$ source ~/testarea/14.2.21/PhysicsAnalysis/DistributedAnalysis/PandaTools/cmt/setup.sh
 }}}
   ==== Lancer le job ====
 Pour lancer votre job vous devez taper une commande où vous précisez quelles données vous mettez en entrée et quelles données vous voulez récupérez en sortie.
+  == Lancer le job ==
+Pour lancer votre job vous devez taper une commande où vous précisez quelles données vous mettez en entrée et quelles données vous voulez produire en sortie.
  {{{
+In
+sh-3.00$ pathena --inDS fdr08_run2.0052280.physics_Egamma.merge.AOD.o3_f8_m10 --outDS user08.FabianLambert.panda.0052280.20081112 --site IN2P3-LPSC_DATADISK --split 6  --nEventsPerJob 100 runSingleTopDPDMaker_FDR2.py
+extracting run configuration
+ConfigExtractor > Input=POOL
+ConfigExtractor > Output=THIST AANT
+archive sources
+archive InstallArea
+post sources/jobO
+query files in dataset:fdr08_run2.0052280.physics_Egamma.merge.AOD.o3_f8_m10
+Could not get the # of events from MetaDB for fdr08_run2.0052280.physics_Egamma.merge.AOD.o3_f8_m10
+Enter the number of events per file : 100
+submit
+===================
+ JobID  : 124
+ Status : 0
+  > build
+    PandaID=19093559
+  > run
+    PandaID=19093560-19093565
 }}}
+  Cette ligne d'instruction mérite quelques explications :
+  Cette ligne d'instruction mérite quelques explications : [[BR]]
+  --inDS : Le LDN du dataset de donnée en entrée de votre job.
+  --outDS : Le nom du dataset de sortie dans lequel pathena va stocker vos fichiers. Attention, la nomenclature impose que vos dataset commence par user08.
+  --site : Le nom du site ou se trouve les données, afin que votre job soit envoyé sur le CE associé.
+  --split : Le nombre de sujobs a faire tourner. Ici 6 car le dataset à analyser contient 6 fichiers, pathena va donc "répartir" les taches d'analyse sur plusieurs WN
+  --nEventsPerJob : Le nombre d'évenements à traiter au maximum par subjobs
+ ==== Suivre l'état d'avancement du job ====
+ == Suivre l'état d'avancement du job ==
+ Quand le job est soumis, pathena lui affecte un PandaID. Dans notre cas nous avons plusieurs PandaID car plusieurs sous-job on été lancé.[[BR]]
+ Le premier identifiant (PandaID=19093559) correspond au "pilot job". C'est un job qui va compiler votre package d'analyse et vérifier qu'il n'y a pas d'erreurs.[[BR]]
+ Si ce premier job s'execute sans erreur, vos jobs d'analyse seront ensuite lancés, ils sont identifiés par la plage de PandaID qui suit (PandaID=19093560-19093565).[[BR]]
+ Une fois le job lancé, vous pouvez suivre son état d'avancement sur la page de [http://gridui06.usatlas.bnl.gov:25880/server/pandamon/query Panda]
   ==== Récuperer les données ====