Analyse d'un job avec accès à un SE distant
Ce tutoriel décrit comment exécuter un job sur le CE du LPSC en utilisant des données sur un SE distant.
Pour lancer un job, vous avez besoin de deux fichiers
- Le fichier JDL (Job Description Langage) Le fichier job.jdl est le fichier qui décrit votre job. Dans ce fichier vous trouverez une ligne de commentaire (#...) qui décrit chaque nouvelle instruction du fichier JDL.
- L'executable Le fichier job.sh est le script qui va être exécuter sur la machine distante (le WN)
Utiliser un dataset == Le dataset utilisé est valid1.007000.singlepart_e_Et10.bstream.BS.e322_s412_b25. Notez les guid des deux premiers fichiers qu'il contient
[lambert@lpsc-ui JDL_InputSandBox_remote_gsiftp]$ dq2-list-files valid1.007000.singlepart_e_Et10.bstream.BS.e322_s412_b25 ... BS.021085._00013.data.1 c3e3acf3-0728-4e5a-b9f3-9bc71fc938eb md5:d34db6104ff44d7475d5f1957f57e89e 576129736 ...
--> Exercice: Trouvez ce dataset avec AMI et cherchez à quelle type de données il correspond
Trouver l'alias LFN absolu des fichiers
[lambert@lpsc-ui edg5]$ lcg-la guid:c3e3acf3-0728-4e5a-b9f3-9bc71fc938eb lfn:/grid/atlas/dq2/valid1/BS/valid1.007000.singlepart_e_Et10.bstream.BS.e322_s412_b25_tid021085/BS.021085._00013.data.1
-->Exercice: Ouvrez et analysez le fichiers job.jdl. Essayer de le modifier pour utiliser deux autres fichiers de votre choix.
Soumission du job et résultat == Contrairement à glite-wms, la localisation des fichiers sur une machine distante ne peut être indiquée directement dans le JDL. Il faut donc les faire copier depuis le script du job.
[lambert@lpsc-ui edg1]$ edg-job-submit job.jdl Selected Virtual Organisation name (from JDL): atlas Connecting to host node04.datagrid.cea.fr, port 7772 Logging to host node04.datagrid.cea.fr, port 9002 ********************************************************************************************* JOB SUBMIT OUTCOME The job has been successfully submitted to the Network Server. Use edg-job-status command to check job current status. Your job identifier (edg_jobId) is: - https://node04.datagrid.cea.fr:9000/X3df68heDW4vrxR76RmXfA ********************************************************************************************* [lambert@lpsc-ui edg1]$ edg-job-status https://node04.datagrid.cea.fr:9000/X3df68heDW4vrxR76RmXfA ************************************************************* BOOKKEEPING INFORMATION: Status info for the Job : https://node04.datagrid.cea.fr:9000/X3df68heDW4vrxR76RmXfA Current Status: Done (Success) Exit code: 0 Status Reason: Job terminated successfully Destination: lcg2ce.ific.uv.es:2119/jobmanager-pbs-short reached on: Thu Jun 5 12:08:43 2008 ************************************************************* [lambert@lpsc-ui edg1]$ edg-job-get-output https://node04.datagrid.cea.fr:9000/X3df68heDW4vrxR76RmXfA Retrieving files from host: node04.datagrid.cea.fr ( for https://node04.datagrid.cea.fr:9000/X3df68heDW4vrxR76RmXfA ) ********************************************************************************* JOB GET OUTPUT OUTCOME Output sandbox files for the job: - https://node04.datagrid.cea.fr:9000/X3df68heDW4vrxR76RmXfA have been successfully retrieved and stored in the directory: /atlas/lambert/JobOutput/lambert_X3df68heDW4vrxR76RmXfA ********************************************************************************* [lambert@lpsc-ui gliteWMS5]$ cat /tmp/lambert_X3df68heDW4vrxR76RmXfA/std.out Localisation du dataset valid1/BS/valid1.007000.singlepart_e_Et10.bstream.BS.e322_s412_b25_tid021085 Fichier: BS.021085._00013.data.1 Liste des fichiers sur le WN: BS.021085._00013.data.1 https_3a_2f_2flb105.cern.ch_3a9000_2fDLadyaUWPDqFDqCeHuLlsA.output job.sh std.err std.out tmp.IgNVS14151
--> Exercice : Vérifiez que le fichier de données a bien été rapatrié sur le WN
--> Exercice : Quels autres fichiers trouvez vous sur le WN ? Cela correspond il aux instructions votre job.jdl et votre job.sh ?
Last modified
16 years ago
Last modified on 08/10/2008 13:31:54
Note:
See TracWiki
for help on using the wiki.