Difference: VsGolias (1 vs. 22)

Revision 2220 Nov 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 9 to 9
 

Upozornění:

Changed:
<
<
ALERT! Dne 17.11.2008 bude prak2.farm.particle.cz přeinstalován a nebude možné se na něj dále přihlašovat. Pro login uživatelů na farmu Goliáš jsou určené servery ui2.farm.particle.cz a prak3.farm.particle.cz.
>
>
ALERT! Dne 19.11.2008 byl definitivně vypnut server prak2.farm.particle.cz.
 

Ke stažení

Revision 2119 Nov 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 219 to 219
  ALERT! V nové verzi PBSPro 9.2 se nedoporučuje používat starší syntaxi specifikace parametru -l ve tvaru -l nodes= ... :ppn= ... . Měla by se používat novější syntaxe pomocí chunků ve tvaru -l select= ... :ncpus= ... . Zadání pomocí starší verze systém převede do verze novější, ale není zaručeno, že úloha proběhne v pořádku. V žádném případě se nesmí kombinovat obě dvě syntaxe.
Added:
>
>
 ALERT! Kvůli efektivnějšímu fungování fairshare (automatické přidělování výpočetních zdrojů na základě propočítaného času) byly u všech výpočetních uzlů nastaveny multiplikátory, kterými je násoben jednak cput - čas, který úloha zabrala na daném procesoru, jednak walltime - skutečný čas, po který úloha obsazovala výpočetní uzel. Multiplikátory vyjadřují poměr výkonu daného výpočetního uzlu vůči referenci, kterou je stroj typu dl140. Proto hodnoty cput a walltime uvedené v informacích o dané úloze ( příkaz qstat ) neodpovídají skutečným hodnotám. Je třeba si je příslušným multiplikátorem přepočítat. Přehled multiplikátorů pro různé typy strojů je uveden v následující tabulce.

Revision 2005 Nov 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 215 to 215
 
2 uzly, na jednom 2 procesory, na druhém 4 procesory -l select=1:ncpus=2+1:ncpus=4
1 uzel a 1 procesor na 100 hodin skutečného času -l walltime=100:00:00 -l select=1:ncpus=1
Changed:
<
<
... Požadavek mem, resp. vmem - bude doplněno.

Je možné požadovat i konkrétní uzel pomocí resource vnode, to se ale nedoporučuje, protože čekací doba na spuštění úlohy může být v takovém případě velmi dlouhá.

>
>
Je možné požadovat i konkrétní uzel pomocí resource vnode. To se ale nedoporučuje, protože čekací doba na spuštění úlohy může být v takovém případě velmi dlouhá.
  ALERT! V nové verzi PBSPro 9.2 se nedoporučuje používat starší syntaxi specifikace parametru -l ve tvaru -l nodes= ... :ppn= ... . Měla by se používat novější syntaxe pomocí chunků ve tvaru -l select= ... :ncpus= ... . Zadání pomocí starší verze systém převede do verze novější, ale není zaručeno, že úloha proběhne v pořádku. V žádném případě se nesmí kombinovat obě dvě syntaxe.
Changed:
<
<
Typ stroje Počet CPU Velikost RAM
lp1000r 2 1GB
dl140 2 2GB
dl140-ht 4 4GB
bl35p 4 8GB
bl20p 4 10GB
bl460c 4 8GB
bl465c 4 8GB

Kvůli efektivnějšímu fungování fairshare (automatické přidělování výpočetních zdrojů na základě propočítaného času) byly u všech výpočetních uzlů nastaveny multiplikátory, kterými je násoben jednak cputime - čas, který úloha zabrala na daném procesoru, jednak walltime - reálný čas, po který úloha obsazovala výpočetní uzel. Multiplikátory vyjadřují poměr výkonu daného výpočetního uzlu vůči referenci, kterou je stroj typu dl140. Přehled multiplikátorů pro různé typy strojů je uveden v následující tabulce.

Typ stroje golias Velikost multiplikátoru
lp1000r golias01 - golias30 0.61
dl140 golias34 - golias79, 95, 96, 99 1
dl140-ht golias80 - golias94 0.6
bl35p Opteron 275 golias101 - golias110 1.44
bl35p Opteron 280 golias111 - golias136 1.76
bl20p Xeon 5160 golias138 - golias142 2.3
bl460c Xeon 5160 golias144 - golias150 2.29
bl465c Opteron 2220 golias151 - golias162 2.3
>
>
ALERT! Kvůli efektivnějšímu fungování fairshare (automatické přidělování výpočetních zdrojů na základě propočítaného času) byly u všech výpočetních uzlů nastaveny multiplikátory, kterými je násoben jednak cput - čas, který úloha zabrala na daném procesoru, jednak walltime - skutečný čas, po který úloha obsazovala výpočetní uzel. Multiplikátory vyjadřují poměr výkonu daného výpočetního uzlu vůči referenci, kterou je stroj typu dl140. Proto hodnoty cput a walltime uvedené v informacích o dané úloze ( příkaz qstat ) neodpovídají skutečným hodnotám. Je třeba si je příslušným multiplikátorem přepočítat. Přehled multiplikátorů pro různé typy strojů je uveden v následující tabulce.

Typ stroje golias Počet CPU Velikost RAM Velikost multiplikátoru
lp1000r golias01 - golias30 2 1GB 0.61
dl140 golias34 - golias79, 95, 96, 99 2 2GB 1
dl140-ht golias80 - golias94 4 4GB 0.6
bl35p Opteron 275 golias101 - golias110 4 8GB 1.44
bl35p Opteron 280 golias111 - golias136 4 8GB 1.76
bl20p Xeon 5160 golias138 - golias142 4 10GB 2.3
bl460c Xeon 5160 golias144 - golias150 4 8GB 2.29
bl465c Opteron 2220 golias151 - golias162 4 8GB 2.3
  ALERT! Důležité upozornění !!! Systém PBS používá pro přenášení výsledků z výpočetních uzlů zpět na server, odkud byla úloha zadána, scp. Pro korektní fungování scp je nutné, aby všechny skripty, které se spouští po přihlášení uživatele (např. .bashrc ), neprodukovaly žádný výstup na obrazovku.
Line: 253 to 243
  qdel <číslo úlohy>
Added:
>
>
 
  • qstat - zobrazí dostupné informace o dané úloze, o dané frontě

qstat -f <číslo úlohy> zobrazí podrobné informace o dané úloze

Revision 1904 Nov 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 230 to 230
 
bl460c 4 8GB
bl465c 4 8GB
Added:
>
>
Kvůli efektivnějšímu fungování fairshare (automatické přidělování výpočetních zdrojů na základě propočítaného času) byly u všech výpočetních uzlů nastaveny multiplikátory, kterými je násoben jednak cputime - čas, který úloha zabrala na daném procesoru, jednak walltime - reálný čas, po který úloha obsazovala výpočetní uzel. Multiplikátory vyjadřují poměr výkonu daného výpočetního uzlu vůči referenci, kterou je stroj typu dl140. Přehled multiplikátorů pro různé typy strojů je uveden v následující tabulce.

Typ stroje golias Velikost multiplikátoru
lp1000r golias01 - golias30 0.61
dl140 golias34 - golias79, 95, 96, 99 1
dl140-ht golias80 - golias94 0.6
bl35p Opteron 275 golias101 - golias110 1.44
bl35p Opteron 280 golias111 - golias136 1.76
bl20p Xeon 5160 golias138 - golias142 2.3
bl460c Xeon 5160 golias144 - golias150 2.29
bl465c Opteron 2220 golias151 - golias162 2.3
 ALERT! Důležité upozornění !!! Systém PBS používá pro přenášení výsledků z výpočetních uzlů zpět na server, odkud byla úloha zadána, scp. Pro korektní fungování scp je nutné, aby všechny skripty, které se spouští po přihlášení uživatele (např. .bashrc ), neprodukovaly žádný výstup na obrazovku.

Zpět

Revision 1804 Nov 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 7 to 7
 Pro snažší komunikaci s uživateli byl zaveden RT (Request Tracking) system . Proto veškeré dotazy a problémy spojené s farmou Goliáš zasílejte výhradně na e-mailovou adresu fzu zavináč rt3.cesnet.cz .
Changed:
<
<

Novinky:

>
>

Upozornění:

 
Changed:
<
<
NEW Klient systému PBS byl naistalován i na server ui2.farm.particle.cz. Uživatelé by se tedy měli přihlašovat především na ui2 nebo na prak3. Prak2 bude zrušen (starší hardware).
>
>
ALERT! Dne 17.11.2008 bude prak2.farm.particle.cz přeinstalován a nebude možné se na něj dále přihlašovat. Pro login uživatelů na farmu Goliáš jsou určené servery ui2.farm.particle.cz a prak3.farm.particle.cz.

Ke stažení

 
Deleted:
<
<
NEW Dne 29.7. 2008 byla nainstalována nová verze systému PBSPro 9.2. Uživatelský manuál PBSProUserGuide9.2 lze stáhnout zde, administrátorský manuál PBSProAdminGuide9.2 zde.
 

Obsah:

Line: 29 to 31
 
  • ui2.farm.particle.cz
  • prak3.farm.particle.cz
Deleted:
<
<
  • prak2.farm.particle.cz
 
Changed:
<
<
Na tyto servery se uživatel přihlašuje. (V současné době si sám zvolí, na který stroj se zaloguje). Na těchto serverech je nainstalován klient systému PBS. Uživatel může své úlohy spouštět, rušit, přesouvat ve frontách, vyzvedávat výsledky. Zároveň může provádět další interaktivní činosti jako např. testovat nebo kompilovat své programy. Výhledově bude pro interaktivní činnosti vyhrazeno několik výpočetních uzlů golias.
>
>
Na tyto servery se uživatel přihlašuje. (V současné době si sám zvolí, na který stroj se zaloguje). Na těchto serverech je nainstalován klient systému PBS. Uživatel může své úlohy spouštět, rušit, přesouvat ve frontách, vyzvedávat výsledky. Zároveň může provádět další interaktivní činnosti jako např. testovat nebo kompilovat své programy. Výhledově bude pro interaktivní činnosti vyhrazeno několik výpočetních uzlů golias.
 
  • golias01 - golias162
Line: 43 to 44
 
  • storage4.farm.particle.cz
  • storage5.farm.particle.cz
Changed:
<
<
Toto jsou fileservery, na kterých jsou uložena data a domovské adresáře. Pomocí NFS jsou namountovány na všech serverech golias a prak jako adresáře /raidN, kde N je číslo v názvu serveru. Pokud je součástí jména adresáře /raidN i jméno experimentu, znamená to, že tento adresář může být využíván pouze pro daný experiment. Soubory uložené v adresáři /raidN se nezálohují! Uživatel si musí soubory sám zkopírovat na jiné místo. Zálohují se pouze domovské adresáře.
>
>
Toto jsou fileservery, na kterých jsou uložena data a domovské adresáře. Pomocí NFS jsou namountovány na serverech golias, ui2 a prak3 jako adresáře /raidN, kde N je číslo v názvu serveru. Pokud je součástí jména adresáře /raidN i jméno experimentu, znamená to, že tento adresář může být využíván pouze pro daný experiment. Soubory uložené v adresáři /raidN se nezálohují! Uživatel si musí soubory sám zkopírovat na jiné místo. Zálohují se pouze domovské adresáře /home.
  Zpět
Line: 84 to 85
 
  • file limits - limity omezující počet uložených souborů (tyto limity nejsou nastavené)
  • grace - doba, po kterou může být překročen soft limit (standardní nastavení je 7 dnů)
Deleted:
<
<
Pozn.: Při zalogování na prak2 se uživateli automaticky zobrazí velikost obsazeného prostoru a nastavené kvóty. Uživatel je také upozorněn v případě, že překročil soft limit. Toto řešení je pouze dočasné. Výhledově bude uživatel upozorněn na překročení soft limitu e-mailem.
 Zvýšení kvóty

Pokud uživatel potřebuje v adresáři /home větší prostor, může požádat o zvýšení kvóty. Svou žádost náležitě odůvodní a pošle prostřednictvím e-mailu Janu Švecovi nebo Tomáši Koubovi.

Deleted:
<
<
ALERT! V adresáři /home se nachází soubor .rhosts. Tento soubor je nezbytný pro potřeby administrátorů. Nesmí být smazán!
 

2.2 Pracovní adresář /scratch

Line: 146 to 143
  Pozn.: Po instalaci systému LDAP proběhne přeregistrování všech uživatelů, vytvoří se nové uživatelské skupiny a v důsledku toho se také změní současná struktura front.
Deleted:
<
<
...
 Zpět
Added:
>
>
 

3.2 Příkaz qsub

Line: 178 to 174
 
-l seznam požadavků na výpočetní zdroje

Výpočetní uzly mají vlastnosti popisující jejich architekturu, operační systém, zvláštní vybavení, typ, atd.

Changed:
<
<
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ... ) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSProUserGuide 9.2 , zde si ve zkratce přiblížíme pouze základní využití této funkcionality systému PBSPro.
>
>
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ... ) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSProUserGuide 9.2 . Zde si ve zkratce přiblížíme pouze základní využití této funkcionality systému PBSPro.
 

Tabulka nejčastějších požadavků úlohy na výpočetní zdroje:

Line: 264 to 260
 

4.1 Zálohování dat

Changed:
<
<
Zálohují se pouze data na svazku /home systémem Legato Net Worker (Produkt firmy EMC pro zálohování rozsáhlé sítě s velkým množstvím dat. Pracuje na principu klient-server). Zálohy se zapisují na pásky o velikosti 400 GB (bez komprese), v létě 2008 jsou vyhrazeny 3 pásky. Kažou noc se provádí inkrementální záloha a jednou za měsíc plná záloha. Uchováváme 4 verze plných záloh, tj. data jsou přístupná s minimálně 3 měsíční historií.
>
>
Zálohují se pouze data na svazku /home systémem Legato Net Worker (Produkt firmy EMC pro zálohování rozsáhlé sítě s velkým množstvím dat. Pracuje na principu klient-server). Zálohy se zapisují na pásky o velikosti 400 GB (bez komprese), v současné době jsou vyhrazeny 3 pásky. Každou noc se provádí inkrementální záloha a jednou za měsíc plná záloha. Uchováváme 4 verze plných záloh, tj. data jsou přístupná s minimálně 3 měsíční historií.
 

4.2 Obnova dat

Revision 1705 Sep 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 9 to 9
 

Novinky:

Changed:
<
<
NEW Klient systému PBS byl naistalován i na server ui2.farm.particle.cz. Uživatelé by se tedy měli přihlašovat především na ui2 nebo na prak3. Prak2 bude výhledově zrušen (starší hardware).
>
>
NEW Klient systému PBS byl naistalován i na server ui2.farm.particle.cz. Uživatelé by se tedy měli přihlašovat především na ui2 nebo na prak3. Prak2 bude zrušen (starší hardware).
  NEW Dne 29.7. 2008 byla nainstalována nová verze systému PBSPro 9.2. Uživatelský manuál PBSProUserGuide9.2 lze stáhnout zde, administrátorský manuál PBSProAdminGuide9.2 zde.
Line: 51 to 51
  Každý nový zájemce o používání farmy Goliáš musí vyplnit Žádost o zřízení účtu. Žádost je nutné v papírové formě zaslat na sekretariát Sekce fyziky elementárních částic FZÚ. Pro urychlení celé procedury je možné žádost poslat faxem (fax: 286 585 443) a originál doručit do čtrnácti dnů.
Changed:
<
<
Jakmile obdržíte e-mailem potvrzení o zřízení účtu, je nutné se přihlásit na ui2 nebo na prak3 a pomocí příkazu passwd změnit přístupové heslo. Téměř na všech výpočetních uzlech už je nainstalován systém LDAP (Lightweight Directory Access Protocol), proto stačí změnu provést jen na jednom uzlu, na ostatních ldapizovaných uzlech se heslo změní automaticky. (Neplatí pro prak2. Tam je třeba heslo změnit samostatně).
>
>
Jakmile obdržíte e-mailem potvrzení o zřízení účtu, je nutné se přihlásit na golias.farm.particle.cz a potom na ui2.farm.particle.cz nebo na prak3.farm.particle.cz a pomocí příkazu passwd změnit přístupové heslo.
 Heslo by mělo být silné, tzn. mělo by se skládat alespoň z 8 znaků a obsahovat malá a velká písmena, číslice a nealfanumerické znaky (např. %, &, *, # apod.).
Changed:
<
<
Pozn.: Po instalaci systému LDAP bude uživatel při prvním přihlášení na ui2 nebo prak3 automaticky vyzván ke změně hesla. Dokud si heslo nezmění, nebude mít možnost dále pracovat.
>
>
Pozn.: Po dokončení instalaci systému LDAP ( Lightweight Directory Access Protocol ) bude nový uživatel při prvním přihlášení na ui2 nebo prak3 automaticky vyzván ke změně svého hesla. Dokud si heslo nezmění, nebude mít možnost dále pracovat.
  Každý nový uživatel farmy Goliáš je automaticky přihlášen do e-mailové skupiny hepfarm zavináč heplist.fzu.cz. Prostřednictvím toho e-mailu bude informován o novinkách, o změnách v konfiguraci, o plánovaném výpadku farmy apod.

Revision 1628 Aug 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 6 to 6
  Pro snažší komunikaci s uživateli byl zaveden RT (Request Tracking) system . Proto veškeré dotazy a problémy spojené s farmou Goliáš zasílejte výhradně na e-mailovou adresu fzu zavináč rt3.cesnet.cz .
Added:
>
>

Novinky:

NEW Klient systému PBS byl naistalován i na server ui2.farm.particle.cz. Uživatelé by se tedy měli přihlašovat především na ui2 nebo na prak3. Prak2 bude výhledově zrušen (starší hardware).

 NEW Dne 29.7. 2008 byla nainstalována nová verze systému PBSPro 9.2. Uživatelský manuál PBSProUserGuide9.2 lze stáhnout zde, administrátorský manuál PBSProAdminGuide9.2 zde.
Line: 22 to 27
  Na tomto stroji běží server systému PBSPro (Portable Batch System), který má na starosti plánování a spouštění úloh na farmě Goliáš.
Changed:
<
<
  • prak2.farm.particle.cz
>
>
  • ui2.farm.particle.cz
 
  • prak3.farm.particle.cz
Added:
>
>
  • prak2.farm.particle.cz
 
Changed:
<
<
Na tyto dva servery se uživatel přihlašuje. (V současné době si sám zvolí, na který prak se zaloguje). Na těchto strojích je nainstalován klient systému PBS. Uživatel může své úlohy spouštět, rušit, přesouvat ve frontách, vyzvedávat výsledky. Zároveň může provádět další interaktivní činosti jako např. testovat nebo kompilovat své programy. Výhledově bude pro interaktivní činnosti vyhrazeno několik výpočetních uzlů golias.
>
>
Na tyto servery se uživatel přihlašuje. (V současné době si sám zvolí, na který stroj se zaloguje). Na těchto serverech je nainstalován klient systému PBS. Uživatel může své úlohy spouštět, rušit, přesouvat ve frontách, vyzvedávat výsledky. Zároveň může provádět další interaktivní činosti jako např. testovat nebo kompilovat své programy. Výhledově bude pro interaktivní činnosti vyhrazeno několik výpočetních uzlů golias.
 
  • golias01 - golias162
Line: 45 to 51
  Každý nový zájemce o používání farmy Goliáš musí vyplnit Žádost o zřízení účtu. Žádost je nutné v papírové formě zaslat na sekretariát Sekce fyziky elementárních částic FZÚ. Pro urychlení celé procedury je možné žádost poslat faxem (fax: 286 585 443) a originál doručit do čtrnácti dnů.
Changed:
<
<
Jakmile obdržíte e-mailem potvrzení o zřízení účtu, je nutné se přihlásit na prak2 a na prak3 a pomocí příkazu passwd změnit přístupové heslo. Heslo by mělo být silné, tzn. mělo by se skládat alespoň z 8 znaků a obsahovat malá a velká písmena, číslice a nealfanumerické znaky (např. %, &, *, # apod.).
>
>
Jakmile obdržíte e-mailem potvrzení o zřízení účtu, je nutné se přihlásit na ui2 nebo na prak3 a pomocí příkazu passwd změnit přístupové heslo. Téměř na všech výpočetních uzlech už je nainstalován systém LDAP (Lightweight Directory Access Protocol), proto stačí změnu provést jen na jednom uzlu, na ostatních ldapizovaných uzlech se heslo změní automaticky. (Neplatí pro prak2. Tam je třeba heslo změnit samostatně). Heslo by mělo být silné, tzn. mělo by se skládat alespoň z 8 znaků a obsahovat malá a velká písmena, číslice a nealfanumerické znaky (např. %, &, *, # apod.).
 
Changed:
<
<
Pozn.: Po instalaci systému LDAP bude uživatel při prvním přihlášení na kterýkoliv z praků automaticky vyzván ke změně hesla. Dokud si heslo nezmění, nebude mít možnost dále pracovat.
>
>
Pozn.: Po instalaci systému LDAP bude uživatel při prvním přihlášení na ui2 nebo prak3 automaticky vyzván ke změně hesla. Dokud si heslo nezmění, nebude mít možnost dále pracovat.
  Každý nový uživatel farmy Goliáš je automaticky přihlášen do e-mailové skupiny hepfarm zavináč heplist.fzu.cz. Prostřednictvím toho e-mailu bude informován o novinkách, o změnách v konfiguraci, o plánovaném výpadku farmy apod.
Line: 64 to 71
  Prostor domovského adresáře je ale omezen kvótou. Rozlišujeme dva stupně: soft limit a hard limit. V současné době je soft limit standardně nastaven na hodnotu 2GB, hard limit na hodnotu 2,5GB. Hard limit už překročit nelze.
Changed:
<
<
NEW Při zalogování na prak2 se uživateli automaticky zobrazí velikost obsazeného prostoru a nastavené kvóty. Uživatel je také upozorněn v případě, že překročil soft limit.

Pozn. : Toto řešení je pouze dočasné. Výhledově bude uživatel upozorněn na překročení soft limitu e-mailem.

Míru zaplnění adresáře /home a výši limitů lze také zjistit po zalogování na prak2 nebo prak3 pomocí příkazu

>
>
Míru zaplnění adresáře /home a výši limitů lze zjistit po zalogování na ui2 nebo prak3 pomocí příkazu
  ssh storage5 /usr/sbin/repquota -s /home
Line: 81 to 84
 
  • file limits - limity omezující počet uložených souborů (tyto limity nejsou nastavené)
  • grace - doba, po kterou může být překročen soft limit (standardní nastavení je 7 dnů)
Added:
>
>
Pozn.: Při zalogování na prak2 se uživateli automaticky zobrazí velikost obsazeného prostoru a nastavené kvóty. Uživatel je také upozorněn v případě, že překročil soft limit. Toto řešení je pouze dočasné. Výhledově bude uživatel upozorněn na překročení soft limitu e-mailem.
 Zvýšení kvóty

Pokud uživatel potřebuje v adresáři /home větší prostor, může požádat o zvýšení kvóty. Svou žádost náležitě odůvodní a pošle prostřednictvím e-mailu Janu Švecovi nebo Tomáši Koubovi.

Line: 91 to 97
  Na každém výpočetním uzlu je lokální pracovní prostor /scratch. Do tohoto prostoru by se měly ukládat mezivýsledky výpočtů. Při spuštění úlohy se v adresáři /scratch automaticky vytvoří podadresář /pbstmp.cislojobu.golias. Současně se vytvoří proměnná $TMPDIR, která do tohoto adresáře ukazuje. Po skončení úlohy se tento podadresář automaticky smaže. Tímto způsobem se prostor /scratch průběžně promazává. Proto je třeba ve skriptech, kterými se úlohy zadávají do front, používat pro uložení dočasných dat proměnnou $TMPDIR.
Added:
>
>
ALERT! Na všech výpočetních uzlech jsou v pracovním adresáři /scratch automaticky promazávány všechny soubory, od jejichž posledního přístupu uběhlo více než 10 dní ( atime přesáhl 240 hodin).
 Zpět
Line: 129 to 137
  Příklad: Fronta q1 má nejvyšší prioritu, fronty q2 a q3 mají vyhrazený počet procesorů a stejnou prioritu. Ve frontě q1 čeká n1 úloh, ve frontě q2 běží m2 úloh a čeká n2 úloh a ve frontě q3 čeká n3 úloh. V okamžiku, kdy se uvolní jeden procesor, systém PBS by spustil úlohu z fronty q1 (nejvyšší priorita), ale vzhledem k tomu, že fronty q2 a q3 ještě nenaplnily svůj počet vyhrazených procesorů, spustí se úloha z fronty q2. Při uvolnění dalšího procesoru se spustí úloha z fronty q3 (stejná priorita). Tento postup se opakuje až do doby, kdy fronty q2 a q3 vyčerpají svůj počet rezervovaných procesorů nebo ve frontách už nečekají další úlohy.
Changed:
<
<
Uživatel zadává svou úlohu do fronty z praku2 nebo z praku3 pomocí příkazu qsub.
>
>
Uživatel zadává svou úlohu do fronty z ui2 nebo z praku3 pomocí příkazu qsub.
 Nesmí posílat úlohy do front označených lcg a také do front testovacích.
Changed:
<
<
Úplný seznam front lze získat po přihlášení na prak2 nebo prak3 pomocí příkazu
>
>
Úplný seznam front lze získat po přihlášení na ui2 nebo prak3 pomocí příkazu
  qstat -q
Line: 170 to 178
 
-l seznam požadavků na výpočetní zdroje

Výpočetní uzly mají vlastnosti popisující jejich architekturu, operační systém, zvláštní vybavení, typ, atd.

Changed:
<
<
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ... ) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSProUserGuide 8.0 , zde si ve zkratce přiblížíme pouze základní využití této funkcionality systému PBSPro.
>
>
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ... ) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSProUserGuide 9.2 , zde si ve zkratce přiblížíme pouze základní využití této funkcionality systému PBSPro.
 

Tabulka nejčastějších požadavků úlohy na výpočetní zdroje:

pbs_resources Popis
Changed:
<
<
nodes/select počet výpočetních uzlů
ppn/ncpus počet procesorů na jednom uzlu
>
>
select počet výpočetních uzlů
ncpus počet procesorů na jednom uzlu
 
mem velikost fyzické paměti
vmem velikost virtuální paměti
walltime množství skutečného času
Line: 203 to 211
 qsub -q <jméno fronty> -l <seznam požadavků na výpočetní zdroje> <váš skript>

Chceme rezervovat Specifikace parametru -l
Changed:
<
<
1 uzel a 1 procesor nodes=1:ppn=1
select=1:ncpus=1
1 uzel a 4 procesory nodes=1:ppn=4
select=1:ncpus=4
1 uzel typu bl35p se 2 procesory nodes=1:ppn=2,model=bl35p
select=1:ncpus=2:model=bl35p
1 uzel typu dl140 s dvěma procesory a 2 uzly typu bl35p s 64bitovým OS nodes=1:ppn=2,model=dl140+2:model=bl35p:bits=64bit
select=1:ncpus=2:model=dl140+2:model=bl35p:bits=64bit
2 uzly, na každém 1 procesor nodes=2:ppn=1
select=2:ncpus=1
2 uzly, na jednom 2 procesory, na druhém 4 procesory nodes=1:ppn=2+1:ppn=4
select=1:ncpus=2+1:ncpus=4
1 uzel a 1 procesor na 100 hodin skutečného času nodes=1:ppn=1,walltime=100:00:00
select=1:ncpus=1:walltime=100:00:00
>
>
1 uzel a 1 procesor -l select=1:ncpus=1
1 uzel a 4 procesory -l select=1:ncpus=4
1 uzel typu bl35p se 2 procesory -l select=1:ncpus=2:model=bl35p
1 uzel typu dl140 s dvěma procesory a 2 uzly typu bl35p s 64bitovým OS -l select=1:ncpus=2:model=dl140+2:model=bl35p:bits=64bit
2 uzly, na každém 1 procesor -l select=2:ncpus=1
2 uzly, na jednom 2 procesory, na druhém 4 procesory -l select=1:ncpus=2+1:ncpus=4
1 uzel a 1 procesor na 100 hodin skutečného času -l walltime=100:00:00 -l select=1:ncpus=1
  ... Požadavek mem, resp. vmem - bude doplněno.

Je možné požadovat i konkrétní uzel pomocí resource vnode, to se ale nedoporučuje, protože čekací doba na spuštění úlohy může být v takovém případě velmi dlouhá.

Added:
>
>
ALERT! V nové verzi PBSPro 9.2 se nedoporučuje používat starší syntaxi specifikace parametru -l ve tvaru -l nodes= ... :ppn= ... . Měla by se používat novější syntaxe pomocí chunků ve tvaru -l select= ... :ncpus= ... . Zadání pomocí starší verze systém převede do verze novější, ale není zaručeno, že úloha proběhne v pořádku. V žádném případě se nesmí kombinovat obě dvě syntaxe.
 
Typ stroje Počet CPU Velikost RAM
lp1000r 2 1GB
dl140 2 2GB
Line: 265 to 270
  Obnova ztracených dat se provádí ze stroje storage5 příkazem nwrecover. Program se nastaví do adresáře, z něhož je zavolán.
Changed:
<
<
V případě, že chcete obnovit smazaný soubor, musíte se přihlásit na prak2 nebo prak3 pomocí ssh -X a potom se už bez hesla zalogovat na storage5
>
>
V případě, že chcete obnovit smazaný soubor, musíte se přihlásit na ui2 nebo prak3 pomocí ssh -X a potom se už bez hesla zalogovat na storage5
  ssh storage5

Revision 1519 Aug 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 111 to 111
 
  • fronty experimentů (atlas, d0, alice, star, auger, ... )
  • fronty pro uživatele ze Sekce vysokých energií FZÚ nezařazených v jiných projektech (fronty long a short)
Changed:
<
<
  • fronty pro uživatele ze Sekce materiálový výzkum, t.j. pro uživatele subclusteru David (fronty solid a tsolid)
>
>
  • fronty pro uživatele ze Sekce materiálový výzkum, t.j. pro uživatele subclusteru David (fronty solid a isolid)
 
  • fronty testovací (test, lcgtest ... ).

Fronty experimentů se dále dělí na fronty produkční a fronty neprodukční. Experimenty podporované gridovým projektem mají ještě fronty, jejichž název začíná lcg. Tyto fronty slouží pouze ke spuštění úloh zadaných přes grid.

Line: 160 to 160
 
Parametr Popis
-q jméno fronty
Changed:
<
<
-I interaktivní úloha, podrobnosti zde
>
>
-I interaktivní úloha, podrobnosti zde
 
-m zaslání e-mailu, není-li specifikováno, žádný e-mail se neposílá
a (abort) – zpráva o přerušení úlohy
b (begin) – zpráva o spuštění úlohy

Revision 1413 Aug 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 49 to 49
  Pozn.: Po instalaci systému LDAP bude uživatel při prvním přihlášení na kterýkoliv z praků automaticky vyzván ke změně hesla. Dokud si heslo nezmění, nebude mít možnost dále pracovat.
Added:
>
>
Každý nový uživatel farmy Goliáš je automaticky přihlášen do e-mailové skupiny hepfarm zavináč heplist.fzu.cz. Prostřednictvím toho e-mailu bude informován o novinkách, o změnách v konfiguraci, o plánovaném výpadku farmy apod.
 Zpět
Line: 143 to 145
 

3.2 Příkaz qsub

Changed:
<
<
Úlohy se zadávají do fronty pomocí příkazu qsub. Příkaz vrátí Job ID.
>
>
Úloha (job) je v zásadě skript, který si uživatel předem připraví a potom zadá do fronty pomocí příkazu qsub. Příkaz vrátí Job ID.
  qsub -q <jméno fronty> <seznam parametrů> <váš skript>

1234567.golias

Changed:
<
<
Tabulka nejčastějších parametrů příkazu qsub:
>
>
Uživatel může specifikovat parametry dvěma způsoby:
  • v příkazu qsub
  • přímo ve svém skriptu

Tabulka nejčastějších parametrů:

 
Parametr Popis
-q jméno fronty
Line: 163 to 170
 
-l seznam požadavků na výpočetní zdroje

Výpočetní uzly mají vlastnosti popisující jejich architekturu, operační systém, zvláštní vybavení, typ, atd.

Changed:
<
<
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ... ) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSProUserGuide , zde si ve zkratce přiblížíme pouze základní využití této funkcionality systému PBSPro.
>
>
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ... ) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSProUserGuide 8.0 , zde si ve zkratce přiblížíme pouze základní využití této funkcionality systému PBSPro.
  Tabulka nejčastějších požadavků úlohy na výpočetní zdroje:
Line: 180 to 188
  -l select=[N:] chunk [+[N:] chunk ...]
Changed:
<
<
Pokud N neuvedete, dosadí se do něj automaticky hodnota 1.
>
>
Pokud N není uvedeno, dosadí se automaticky hodnota 1.
 Samotný chunk pak tvoří jeden nebo více výrazů, oddělených dvojtečkou, ve tvaru <resource_name=hodnota>.
Added:
>
>
-l select=N:<resource_name1=hodnota1>:<resource_name2=hodnota2> ...

Kromě tzv. per-chunk limitů, které úloha požaduje na jeden výpočetní uzel, rozlišujeme ještě tzv. job-wide limity, které požaduje úloha jako celek. Ty jsou v příkazu qsub vypsány samostatně s parametrem -l, tzn. nezařazují se do chunků. Mezi tyto požadavky patří např. walltime a cput.

-l <resource_name=hodnota>

 Příklady:

qsub -q <jméno fronty> -l <seznam požadavků na výpočetní zdroje> <váš skript>

Revision 1311 Aug 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 143 to 143
 

3.2 Příkaz qsub

Changed:
<
<
Úlohy se zadávají do fronty pomocí příkazu qsub.
>
>
Úlohy se zadávají do fronty pomocí příkazu qsub. Příkaz vrátí Job ID.
  qsub -q <jméno fronty> <seznam parametrů> <váš skript>
Changed:
<
<
Tabulka parametrů příkazu qsub:
>
>
1234567.golias

Tabulka nejčastějších parametrů příkazu qsub:

 
Parametr Popis
-q jméno fronty
Line: 156 to 158
 
a (abort) – zpráva o přerušení úlohy
b (begin) – zpráva o spuštění úlohy
e (end) – zpráva o ukončení úlohy
Changed:
<
<
-o kam uložit výstupní soubor stdout , není-li specifikováno, stdout se automaticky ukládá do adresáře, ze kterého byl spuštěn příkaz qsub
-e kam uložit chybový soubor stderr , není-li specifikováno, stderr se automaticky ukládá do adresáře, ze kterého byl spuštěn příkaz qsub
>
>
-o kam uložit výstupní soubor stdout ( stdout se automaticky ukládá do adresáře, ze kterého byl spuštěn příkaz qsub )
-e kam uložit chybový soubor stderr ( stderr se automaticky ukládá do adresáře, ze kterého byl spuštěn příkaz qsub )
 
-l seznam požadavků na výpočetní zdroje

Výpočetní uzly mají vlastnosti popisující jejich architekturu, operační systém, zvláštní vybavení, typ, atd.

Line: 190 to 192
 
select=1:ncpus=1
1 uzel a 4 procesory nodes=1:ppn=4
select=1:ncpus=4
Changed:
<
<
1 uzel typu bl35p se 2 procesory nodes=1:ppn=2:model=bl35p
>
>
1 uzel typu bl35p se 2 procesory nodes=1:ppn=2,model=bl35p
 
select=1:ncpus=2:model=bl35p
Changed:
<
<
1 uzel typu dl140 s dvěma procesory a 2 uzly typu bl35p s 64bitovým OS nodes=1:ppn=2:model=dl140+2:model=bl35p:bits=64bit
>
>
1 uzel typu dl140 s dvěma procesory a 2 uzly typu bl35p s 64bitovým OS nodes=1:ppn=2,model=dl140+2:model=bl35p:bits=64bit
 
select=1:ncpus=2:model=dl140+2:model=bl35p:bits=64bit
2 uzly, na každém 1 procesor nodes=2:ppn=1
select=2:ncpus=1
Line: 227 to 229
 
  • qstat - zobrazí dostupné informace o dané úloze, o dané frontě

qstat -f <číslo úlohy> zobrazí podrobné informace o dané úloze
Deleted:
<
<
qstat -q zobrazí všechny fronty na farmě Goliáš
 
qstat -a <jméno fronty> zobrazí všechny úlohy v dané frontě
qstat -au <ID uživatele> zobrazí všechny úlohy daného uživatele
Added:
>
>
qstat -q zobrazí všechny fronty na farmě Goliáš
 
Changed:
<
<
Podrobnější informace najdete na manových stránkách
>
>
Podrobnější informace najdete na manuálových stránkách
  man qstat

Revision 1230 Jul 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 6 to 6
  Pro snažší komunikaci s uživateli byl zaveden RT (Request Tracking) system . Proto veškeré dotazy a problémy spojené s farmou Goliáš zasílejte výhradně na e-mailovou adresu fzu zavináč rt3.cesnet.cz .
Changed:
<
<
NEW Dne 29.7. 2008 byla nainstalována nová verze PBSPro 9.2. Uživatelský manuál PBSProUserGuide9.2 lze stáhnout
>
>
NEW Dne 29.7. 2008 byla nainstalována nová verze systému PBSPro 9.2. Uživatelský manuál PBSProUserGuide9.2 lze stáhnout
 zde, administrátorský manuál PBSProAdminGuide9.2 zde.

Obsah:

Line: 254 to 254
  a zadat příkaz
Changed:
<
<
nwrecover
>
>
nwrecover &
  Dostanete grafické GUI k obnově. Objeví se dvě okna: v levém okně je strom adresářů, v pravém seznam souborů daného adresáře a v horní liště menu. Pomocí volby

Revision 1130 Jul 2008 - FZU.JanSvec

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 7 to 7
 Pro snažší komunikaci s uživateli byl zaveden RT (Request Tracking) system . Proto veškeré dotazy a problémy spojené s farmou Goliáš zasílejte výhradně na e-mailovou adresu fzu zavináč rt3.cesnet.cz .

NEW Dne 29.7. 2008 byla nainstalována nová verze PBSPro 9.2. Uživatelský manuál PBSProUserGuide9.2 lze stáhnout

Changed:
<
<
zde
>
>
zde, administrátorský manuál PBSProAdminGuide9.2 zde.
 

Obsah:

Revision 1030 Jul 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 6 to 6
  Pro snažší komunikaci s uživateli byl zaveden RT (Request Tracking) system . Proto veškeré dotazy a problémy spojené s farmou Goliáš zasílejte výhradně na e-mailovou adresu fzu zavináč rt3.cesnet.cz .
Added:
>
>
NEW Dne 29.7. 2008 byla nainstalována nová verze PBSPro 9.2. Uživatelský manuál PBSProUserGuide9.2 lze stáhnout zde
 

Obsah:

Revision 922 Jul 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 16 to 17
 
  • golias.farm.particle.cz
Changed:
<
<
Na tomto stroji běží server systému PBSPro, který má na starosti plánování a spouštění úloh na farmě Goliáš.
>
>
Na tomto stroji běží server systému PBSPro (Portable Batch System), který má na starosti plánování a spouštění úloh na farmě Goliáš.
 
  • prak2.farm.particle.cz
  • prak3.farm.particle.cz
Line: 47 to 48
  Zpět
Deleted:
<
<

1.3 Adresáře /home a /scratch

1.3.1 Domovský adresář /home

Zálohování

 
Changed:
<
<
Adresář /home je vidět ze všech výpočetních uzlů. Zálohuje se systémem networker. Úplný backup probíhá jednou měsíčně a uchovává se po dobu 3 měsíců. Inkrementální (přírůstkový) backup probíhá denně (zálohují se jenom nové nebo změněné soubory). Pokud chce uživatel obnovit ztracený soubor, musí se zalogovat na prak2 nebo prak3 a potom se už bez hesla pomocí ssh přihlásí na storage5.

ssh storage5

>
>

2. Datové prostory

 
Changed:
<
<
nwrecover&

... Podrobnosti budou doplněny.

>
>

2.1. Domovský adresář /home

  Kvóty
Added:
>
>
Adresář /home je vidět ze všech výpočetních uzlů. Zálohuje se systémem Legato Net Worker. Podrobnější informace o zálohování a obnově souborů naleznete v kapitole 4.
 Prostor domovského adresáře je ale omezen kvótou. Rozlišujeme dva stupně: soft limit a hard limit. V současné době je soft limit standardně nastaven na hodnotu 2GB, hard limit na hodnotu 2,5GB. Hard limit už překročit nelze.

NEW Při zalogování na prak2 se uživateli automaticky zobrazí velikost obsazeného prostoru a nastavené kvóty. Uživatel je také upozorněn v případě, že překročil soft limit.

Line: 86 to 80
  Pokud uživatel potřebuje v adresáři /home větší prostor, může požádat o zvýšení kvóty. Svou žádost náležitě odůvodní a pošle prostřednictvím e-mailu Janu Švecovi nebo Tomáši Koubovi.
Deleted:
<
<
 ALERT! V adresáři /home se nachází soubor .rhosts. Tento soubor je nezbytný pro potřeby administrátorů. Nesmí být smazán!
Changed:
<
<

1.3.2 Pracovní adresář /scratch

>
>

2.2 Pracovní adresář /scratch

  Na každém výpočetním uzlu je lokální pracovní prostor /scratch. Do tohoto prostoru by se měly ukládat mezivýsledky výpočtů. Při spuštění úlohy se v adresáři /scratch automaticky vytvoří podadresář /pbstmp.cislojobu.golias. Současně se vytvoří proměnná $TMPDIR, která do tohoto adresáře ukazuje. Po skončení úlohy se tento podadresář automaticky smaže. Tímto způsobem se prostor /scratch průběžně promazává. Proto je třeba ve skriptech, kterými se úlohy zadávají do front, používat pro uložení dočasných dat proměnnou $TMPDIR.

Zpět

Deleted:
<
<

2. Zadávání úloh

 
Changed:
<
<

2.1 Typy front

>
>

3. Zadávání úloh

3.1 Typy front

  Některé fronty jsou vyhrazené pro speciální projekty (experimenty), pro určité skupiny uživatelů nebo pro speciální typ úloh (interaktivní úlohy apod.). Fronty mají při spuštění úloh různou prioritu. Mohou mít také nastavené různé limity. Např.:
Line: 144 to 138
 Zpět

Changed:
<
<

2.2 Příkaz qsub

>
>

3.2 Příkaz qsub

  Úlohy se zadávají do fronty pomocí příkazu qsub.
Line: 164 to 158
 
-l seznam požadavků na výpočetní zdroje

Výpočetní uzly mají vlastnosti popisující jejich architekturu, operační systém, zvláštní vybavení, typ, atd.

Changed:
<
<
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ... ) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSProUserGuide, zde si ve zkratce přiblížíme pouze základní využití této funkcionality systému PBSPro.
>
>
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ... ) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSProUserGuide , zde si ve zkratce přiblížíme pouze základní využití této funkcionality systému PBSPro.
  Tabulka nejčastějších požadavků úlohy na výpočetní zdroje:
Line: 221 to 215
  Zpět
Changed:
<
<

2.3 Další užitečné příkazy PBS

>
>

3.3 Další užitečné příkazy PBS

 
  • qdel - vymaže úlohu z fronty
Line: 240 to 234
  Zpět
Changed:
<
<

3. Práce s certifikátem

>
>

4. Zálohování a obnova dat

4.1 Zálohování dat

Zálohují se pouze data na svazku /home systémem Legato Net Worker (Produkt firmy EMC pro zálohování rozsáhlé sítě s velkým množstvím dat. Pracuje na principu klient-server). Zálohy se zapisují na pásky o velikosti 400 GB (bez komprese), v létě 2008 jsou vyhrazeny 3 pásky. Kažou noc se provádí inkrementální záloha a jednou za měsíc plná záloha. Uchováváme 4 verze plných záloh, tj. data jsou přístupná s minimálně 3 měsíční historií.

4.2 Obnova dat

Obnova ztracených dat se provádí ze stroje storage5 příkazem nwrecover. Program se nastaví do adresáře, z něhož je zavolán.

V případě, že chcete obnovit smazaný soubor, musíte se přihlásit na prak2 nebo prak3 pomocí ssh -X a potom se už bez hesla zalogovat na storage5

ssh storage5

a zadat příkaz

nwrecover

Dostanete grafické GUI k obnově. Objeví se dvě okna: v levém okně je strom adresářů, v pravém seznam souborů daného adresáře a v horní liště menu. Pomocí volby

Change -> Browse Time...

zvolte datum zálohy dřívější, než kdy byl už soubor smazán, a potvrďte OK. Soubor můžete vyhledávat pomocí volby Search . Klikněte na soubor ("políčko zčerná") a volbou

Mark

označte (modré zaškrtnutí). Pokud chcete soubor uložit do jiného adresáře než do původního, použijte volbu

Options -> Relocate...

zadejte jméno adresáře a potvrďte OK. Spusťte obnovu volbou

Start

Soubor je možné přímo přepsat nebo uložit pod pozměněným jménem. Program možnosti nabídne v dalším okně.

Najednou lze obnovit i více souborů (všechny označené modrým zaškrtnutím) nebo celý adresář.

Obnova je snažší, pokud si pamatujete jméno souboru a přibližné datum, kdy jste soubor naposledy editovali.

Zpět

 
Changed:
<
<

3.1 Získání certifikátu

>
>

5. Práce s certifikátem

5.1 Získání certifikátu

 Certfikát lze získat od certifikační autority CESNETu, o osobní certifikát se žádá zde.
Changed:
<
<

3.2 Převod do jiných formátů

>
>

5.2 Převod do jiných formátů

 Certfikát je typicky uložen do internetového prohlížeče. Exportem certifikátu získáme soubor s příponou p12. Pro použití v gridovém prostředí je třeba ho převést do formátu pem příkazy:
Line: 256 to 297
  Zpět
Deleted:
<
<

4. Zálohování dat

Zálohují se pouze data na svazku /home. Zálohy se zapisují na pásky o velikosti 400 GB (bez komprese), v létě 2008 jsou vyhrazeny 3 pásky. Kažou noc se provádí inkrementální záloha a jednou za měsíc plná záloha. Uchováváme 4 verze plných záloh, tj. data jsou přístupná s minimálně 3 měsíční historií.

Obnova ztracených dat se provádí ze stroje storage5 příkazem nwrecover.

  -- JanaUhlirova - 01 Jul 2008

Revision 821 Jul 2008 - FZU.JiriChudoba

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 256 to 256
  Zpět
Added:
>
>

4. Zálohování dat

Zálohují se pouze data na svazku /home. Zálohy se zapisují na pásky o velikosti 400 GB (bez komprese), v létě 2008 jsou vyhrazeny 3 pásky. Kažou noc se provádí inkrementální záloha a jednou za měsíc plná záloha. Uchováváme 4 verze plných záloh, tj. data jsou přístupná s minimálně 3 měsíční historií.

Obnova ztracených dat se provádí ze stroje storage5 příkazem nwrecover.

  -- JanaUhlirova - 01 Jul 2008 \ No newline at end of file

Revision 703 Jul 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 35 to 35
  Toto jsou fileservery, na kterých jsou uložena data a domovské adresáře. Pomocí NFS jsou namountovány na všech serverech golias a prak jako adresáře /raidN, kde N je číslo v názvu serveru. Pokud je součástí jména adresáře /raidN i jméno experimentu, znamená to, že tento adresář může být využíván pouze pro daný experiment. Soubory uložené v adresáři /raidN se nezálohují! Uživatel si musí soubory sám zkopírovat na jiné místo. Zálohují se pouze domovské adresáře.
Deleted:
<
<
Podrobnou HW konfiguraci farmy Goliáš naleznete [zde]
 Zpět

1.2 Nový uživatel

Line: 55 to 53
  Zálohování
Changed:
<
<
Adresář /home je vidět ze všech výpočetních uzlů. Zálohuje se systémem networker. Pokud chce uživatel obnovit ztracený soubor, musí se zalogovat na prak2 nebo prak3 a potom se už bez hesla pomocí ssh přihlásí na storage5.
>
>
Adresář /home je vidět ze všech výpočetních uzlů. Zálohuje se systémem networker. Úplný backup probíhá jednou měsíčně a uchovává se po dobu 3 měsíců. Inkrementální (přírůstkový) backup probíhá denně (zálohují se jenom nové nebo změněné soubory). Pokud chce uživatel obnovit ztracený soubor, musí se zalogovat na prak2 nebo prak3 a potom se už bez hesla pomocí ssh přihlásí na storage5.
  ssh storage5

nwrecover&

Changed:
<
<
...
>
>
... Podrobnosti budou doplněny.
  Kvóty
Line: 210 to 208
  Je možné požadovat i konkrétní uzel pomocí resource vnode, to se ale nedoporučuje, protože čekací doba na spuštění úlohy může být v takovém případě velmi dlouhá.
Added:
>
>
Typ stroje Počet CPU Velikost RAM
lp1000r 2 1GB
dl140 2 2GB
dl140-ht 4 4GB
bl35p 4 8GB
bl20p 4 10GB
bl460c 4 8GB
bl465c 4 8GB
 ALERT! Důležité upozornění !!! Systém PBS používá pro přenášení výsledků z výpočetních uzlů zpět na server, odkud byla úloha zadána, scp. Pro korektní fungování scp je nutné, aby všechny skripty, které se spouští po přihlášení uživatele (např. .bashrc ), neprodukovaly žádný výstup na obrazovku.

Zpět

Revision 603 Jul 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 67 to 67
  Prostor domovského adresáře je ale omezen kvótou. Rozlišujeme dva stupně: soft limit a hard limit. V současné době je soft limit standardně nastaven na hodnotu 2GB, hard limit na hodnotu 2,5GB. Hard limit už překročit nelze.
Changed:
<
<
NEW Při zalogování na prak2 nebo prak3 se uživateli automaticky zobrazí velikost obsazeného prostoru a nastavené kvóty. Uživatel je také upozorněn v případě, že překročil soft limit.
>
>
NEW Při zalogování na prak2 se uživateli automaticky zobrazí velikost obsazeného prostoru a nastavené kvóty. Uživatel je také upozorněn v případě, že překročil soft limit.
 
Changed:
<
<
Míru zaplnění adresáře /home a výši limitů lze také zjistit pomocí příkazu
>
>
Pozn. : Toto řešení je pouze dočasné. Výhledově bude uživatel upozorněn na překročení soft limitu e-mailem.

Míru zaplnění adresáře /home a výši limitů lze také zjistit po zalogování na prak2 nebo prak3 pomocí příkazu

  ssh storage5 /usr/sbin/repquota -s /home
Line: 164 to 166
 
-l seznam požadavků na výpočetní zdroje

Výpočetní uzly mají vlastnosti popisující jejich architekturu, operační systém, zvláštní vybavení, typ, atd.

Changed:
<
<
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ...) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSPro user guide, zde si ve zkratce přiblížíme pouze základní využití této funcionality systému PBSPro.
>
>
Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ... ) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSProUserGuide, zde si ve zkratce přiblížíme pouze základní využití této funkcionality systému PBSPro.
  Tabulka nejčastějších požadavků úlohy na výpočetní zdroje:
Line: 176 to 178
 
walltime množství skutečného času
cput množství času CPU
Changed:
<
<
Ostatní dostupné zdroje a vlastnosti (dále jen resources) je možné vypsat pomocí příkazu pbsnodes. Při zadávání úlohy pomocí příkazu qsub pak uživatel přepínačem -l definuje požadované resources, nejčastěji přes tzv. chunky (anglicky chunks). Chunk je seznam požadovaných resources a jejich hodnot, které jsou úloze alokovány z jednoho uzlu. Kromě obsahu chunku uživatel při zadávání úlohy specifikuje i jejich počet (N) následujícím způsobem:
>
>
Ostatní dostupné zdroje a vlastnosti (dále jen resources) je možné vypsat pomocí příkazu pbsnodes. Při zadávání úlohy pomocí příkazu qsub pak uživatel přepínačem -l definuje požadované resources, nejčastěji přes tzv. chunky (anglicky chunks). Chunk je seznam požadovaných resources a jejich hodnot, které jsou úloze alokovány z jednoho uzlu. Kromě obsahu chunku uživatel při zadávání úlohy specifikuje i jejich počet N následujícím způsobem:
 
Changed:
<
<
-l select=[N:]chunk[+[N:]chunk ...]
>
>
-l select=[N:] chunk [+[N:] chunk ...]
  Pokud N neuvedete, dosadí se do něj automaticky hodnota 1. Samotný chunk pak tvoří jeden nebo více výrazů, oddělených dvojtečkou, ve tvaru <resource_name=hodnota>.
Line: 191 to 193
 
Chceme rezervovat Specifikace parametru -l
1 uzel a 1 procesor nodes=1:ppn=1
select=1:ncpus=1
Changed:
<
<
1 uzel a 2 procesory nodes=1:ppn=2
select=1:ncpus=2
>
>
1 uzel a 4 procesory nodes=1:ppn=4
select=1:ncpus=4
1 uzel typu bl35p se 2 procesory nodes=1:ppn=2:model=bl35p
select=1:ncpus=2:model=bl35p
 
1 uzel typu dl140 s dvěma procesory a 2 uzly typu bl35p s 64bitovým OS nodes=1:ppn=2:model=dl140+2:model=bl35p:bits=64bit
select=1:ncpus=2:model=dl140+2:model=bl35p:bits=64bit
Changed:
<
<
2 uzly a na každém 1 procesor nodes=2:ppn=1
>
>
2 uzly, na každém 1 procesor nodes=2:ppn=1
 
select=2:ncpus=1
Changed:
<
<
1 uzel a 1 procesor na 100 hodin skutečného času a paměť 200MB nodes=1:ppn=1,walltime=100:00:00,mem=200mb
select=1:ncpus=1:walltime=100:00:00:mem=200mb
1 uzel se 2 procesory, na každém uzlu paměť 3GB nodes=1:ppn=2,mem=3gb
select=1:ncpus=2:mem=3GB
2 uzly, na každém 1 procesor s pamětí 500MB nodes=2:ppn=1,mem=500mb
select=2:ncpus=1:mem=500mb
>
>
2 uzly, na jednom 2 procesory, na druhém 4 procesory nodes=1:ppn=2+1:ppn=4
select=1:ncpus=2+1:ncpus=4
1 uzel a 1 procesor na 100 hodin skutečného času nodes=1:ppn=1,walltime=100:00:00
select=1:ncpus=1:walltime=100:00:00
 
Changed:
<
<
Je možné požadovat i konkrétní uzel pomocí resource vnode, to se ale nedoporučuje, protože čekací doba na spuštění úlohy může být v takovém případě velmi dlouhá.
>
>
... Požadavek mem, resp. vmem - bude doplněno.
 
Changed:
<
<
...
>
>
Je možné požadovat i konkrétní uzel pomocí resource vnode, to se ale nedoporučuje, protože čekací doba na spuštění úlohy může být v takovém případě velmi dlouhá.
  ALERT! Důležité upozornění !!! Systém PBS používá pro přenášení výsledků z výpočetních uzlů zpět na server, odkud byla úloha zadána, scp. Pro korektní fungování scp je nutné, aby všechny skripty, které se spouští po přihlášení uživatele (např. .bashrc ), neprodukovaly žádný výstup na obrazovku.
Line: 222 to 224
 
qstat -f <číslo úlohy> zobrazí podrobné informace o dané úloze
qstat -q zobrazí všechny fronty na farmě Goliáš
Deleted:
<
<
qstat -Q zobrazí nastavené limity pro jednotlivé fronty
 
qstat -a <jméno fronty> zobrazí všechny úlohy v dané frontě
qstat -au <ID uživatele> zobrazí všechny úlohy daného uživatele
Added:
>
>
Podrobnější informace najdete na manových stránkách

man qstat

 Zpět

3. Práce s certifikátem

Revision 502 Jul 2008 - FZU.JanSvec

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 163 to 163
 
-e kam uložit chybový soubor stderr , není-li specifikováno, stderr se automaticky ukládá do adresáře, ze kterého byl spuštěn příkaz qsub
-l seznam požadavků na výpočetní zdroje
Changed:
<
<
Tabulka požadavků úlohy na výpočetní zdroje:
>
>
Výpočetní uzly mají vlastnosti popisující jejich architekturu, operační systém, zvláštní vybavení, typ, atd. Uživatel může při zadávání úlohy specifikovat požadavky na zdroje (čas, paměť, ...) a vlastnosti (architektura, hardware, model) uzlu, které úloha potřebuje. Podrobný popis je uveden v PBSPro user guide, zde si ve zkratce přiblížíme pouze základní využití této funcionality systému PBSPro.

Tabulka nejčastějších požadavků úlohy na výpočetní zdroje:

 
pbs_resources Popis
nodes/select počet výpočetních uzlů
Line: 173 to 176
 
walltime množství skutečného času
cput množství času CPU
Added:
>
>
Ostatní dostupné zdroje a vlastnosti (dále jen resources) je možné vypsat pomocí příkazu pbsnodes. Při zadávání úlohy pomocí příkazu qsub pak uživatel přepínačem -l definuje požadované resources, nejčastěji přes tzv. chunky (anglicky chunks). Chunk je seznam požadovaných resources a jejich hodnot, které jsou úloze alokovány z jednoho uzlu. Kromě obsahu chunku uživatel při zadávání úlohy specifikuje i jejich počet (N) následujícím způsobem:

-l select=[N:]chunk[+[N:]chunk ...]

Pokud N neuvedete, dosadí se do něj automaticky hodnota 1. Samotný chunk pak tvoří jeden nebo více výrazů, oddělených dvojtečkou, ve tvaru <resource_name=hodnota>.

 Příklady:

qsub -q <jméno fronty> -l <seznam požadavků na výpočetní zdroje> <váš skript>

Line: 182 to 193
 
select=1:ncpus=1
1 uzel a 2 procesory nodes=1:ppn=2
select=1:ncpus=2
Added:
>
>
1 uzel typu dl140 s dvěma procesory a 2 uzly typu bl35p s 64bitovým OS nodes=1:ppn=2:model=dl140+2:model=bl35p:bits=64bit
select=1:ncpus=2:model=dl140+2:model=bl35p:bits=64bit
 
2 uzly a na každém 1 procesor nodes=2:ppn=1
select=2:ncpus=1
1 uzel a 1 procesor na 100 hodin skutečného času a paměť 200MB nodes=1:ppn=1,walltime=100:00:00,mem=200mb
select=1:ncpus=1:walltime=100:00:00:mem=200mb
Changed:
<
<
1 uzel se 2 procesory, na každém procesoru paměť 3GB nodes=1:ppn=2,mem=3gb
>
>
1 uzel se 2 procesory, na každém uzlu paměť 3GB nodes=1:ppn=2,mem=3gb
 
select=1:ncpus=2:mem=3GB
2 uzly, na každém 1 procesor s pamětí 500MB nodes=2:ppn=1,mem=500mb
select=2:ncpus=1:mem=500mb
Added:
>
>
Je možné požadovat i konkrétní uzel pomocí resource vnode, to se ale nedoporučuje, protože čekací doba na spuštění úlohy může být v takovém případě velmi dlouhá.
 ...

ALERT! Důležité upozornění !!! Systém PBS používá pro přenášení výsledků z výpočetních uzlů zpět na server, odkud byla úloha zadána, scp. Pro korektní fungování scp je nutné, aby všechny skripty, které se spouští po přihlášení uživatele (např. .bashrc ), neprodukovaly žádný výstup na obrazovku.

Revision 402 Jul 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Line: 14 to 14
 

1.1 Struktura farmy Goliáš

Changed:
<
<
golias.farm.particle.cz
>
>
  • golias.farm.particle.cz
  Na tomto stroji běží server systému PBSPro, který má na starosti plánování a spouštění úloh na farmě Goliáš.
Changed:
<
<
prak2.farm.particle.cz

prak3.farm.particle.cz

>
>
  • prak2.farm.particle.cz
  • prak3.farm.particle.cz
  Na tyto dva servery se uživatel přihlašuje. (V současné době si sám zvolí, na který prak se zaloguje). Na těchto strojích je nainstalován klient systému PBS. Uživatel může své úlohy spouštět, rušit, přesouvat ve frontách, vyzvedávat výsledky. Zároveň může provádět další interaktivní činosti jako např. testovat nebo kompilovat své programy. Výhledově bude pro interaktivní činnosti vyhrazeno několik výpočetních uzlů golias.
Changed:
<
<
golias01 - golias162
>
>
  • golias01 - golias162
  Toto jsou výpočetní neboli pracovní uzly (tzv. worker nody). Nepatří mezi ně golias 10, 15, 25, 31, 32, 33, 59, 97, 98, 100, 137 a 143. (Pro úplnost golias31 - golias99 jsou aliasy pro goliasx31 - goliasx99). Na těchto strojích systém PBS spouští úlohy. Uživatel by se na ně neměl bezdůvodně hlásit.
Changed:
<
<
storage.farm.particle.cz

storage2.farm.particle.cz

storage3.farm.particle.cz

storage4.farm.particle.cz

storage5.farm.particle.cz

>
>
  • storage.farm.particle.cz
  • storage2.farm.particle.cz
  • storage3.farm.particle.cz
  • storage4.farm.particle.cz
  • storage5.farm.particle.cz
  Toto jsou fileservery, na kterých jsou uložena data a domovské adresáře. Pomocí NFS jsou namountovány na všech serverech golias a prak jako adresáře /raidN, kde N je číslo v názvu serveru. Pokud je součástí jména adresáře /raidN i jméno experimentu, znamená to, že tento adresář může být využíván pouze pro daný experiment. Soubory uložené v adresáři /raidN se nezálohují! Uživatel si musí soubory sám zkopírovat na jiné místo. Zálohují se pouze domovské adresáře.
Line: 56 to 51
 

1.3 Adresáře /home a /scratch

Changed:
<
<
Domovský adresář /home
>
>

1.3.1 Domovský adresář /home

  Zálohování
Line: 82 to 77
 
User used soft hard grace used soft hard grace
xxx n 1954M 2442M m 0 0
Changed:
<
<
n - velikost obsazeného prostoru (v kB)

block limits - limity omezující obsazený prostor (v MB)

file limits - limity omezující počet uložených souborů (tyto limity nejsou nastavené)

grace - doba, po kterou může být překročen soft limit (standardní nastavení je 7 dnů)

>
>
  • n - velikost obsazeného prostoru (v kB)
  • block limits - limity omezující obsazený prostor (v MB)
  • file limits - limity omezující počet uložených souborů (tyto limity nejsou nastavené)
  • grace - doba, po kterou může být překročen soft limit (standardní nastavení je 7 dnů)
  Zvýšení kvóty
Line: 94 to 86
  Pokud uživatel potřebuje v adresáři /home větší prostor, může požádat o zvýšení kvóty. Svou žádost náležitě odůvodní a pošle prostřednictvím e-mailu Janu Švecovi nebo Tomáši Koubovi.
Added:
>
>
 ALERT! V adresáři /home se nachází soubor .rhosts. Tento soubor je nezbytný pro potřeby administrátorů. Nesmí být smazán!
Changed:
<
<
Pracovní adresář /scratch
>
>

1.3.2 Pracovní adresář /scratch

  Na každém výpočetním uzlu je lokální pracovní prostor /scratch. Do tohoto prostoru by se měly ukládat mezivýsledky výpočtů. Při spuštění úlohy se v adresáři /scratch automaticky vytvoří podadresář /pbstmp.cislojobu.golias. Současně se vytvoří proměnná $TMPDIR, která do tohoto adresáře ukazuje. Po skončení úlohy se tento podadresář automaticky smaže. Tímto způsobem se prostor /scratch průběžně promazává. Proto je třeba ve skriptech, kterými se úlohy zadávají do front, používat pro uložení dočasných dat proměnnou $TMPDIR.
Line: 200 to 193
  ...
Added:
>
>
ALERT! Důležité upozornění !!! Systém PBS používá pro přenášení výsledků z výpočetních uzlů zpět na server, odkud byla úloha zadána, scp. Pro korektní fungování scp je nutné, aby všechny skripty, které se spouští po přihlášení uživatele (např. .bashrc ), neprodukovaly žádný výstup na obrazovku.
 Zpět

2.3 Další užitečné příkazy PBS

Line: 210 to 205
 
  • qstat - zobrazí dostupné informace o dané úloze, o dané frontě
Changed:
<
<
qstat -f <číslo úlohy>

qstat -a <jméno fronty>

>
>
qstat -f <číslo úlohy> zobrazí podrobné informace o dané úloze
qstat -q zobrazí všechny fronty na farmě Goliáš
qstat -Q zobrazí nastavené limity pro jednotlivé fronty
qstat -a <jméno fronty> zobrazí všechny úlohy v dané frontě
qstat -au <ID uživatele> zobrazí všechny úlohy daného uživatele
  Zpět

Revision 302 Jul 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"

Dokumentace pro uživatele farmy Goliáš

Added:
>
>
Pro snažší komunikaci s uživateli byl zaveden RT (Request Tracking) system . Proto veškeré dotazy a problémy spojené s farmou Goliáš zasílejte výhradně na e-mailovou adresu fzu zavináč rt3.cesnet.cz .
 

Obsah:

Line: 12 to 14
 

1.1 Struktura farmy Goliáš

Changed:
<
<
golias.farm.particle.cz
>
>
golias.farm.particle.cz
  Na tomto stroji běží server systému PBSPro, který má na starosti plánování a spouštění úloh na farmě Goliáš.
Changed:
<
<
prak2.farm.particle.cz
>
>
prak2.farm.particle.cz
 
Changed:
<
<
prak3.farm.particle.cz
>
>
prak3.farm.particle.cz
  Na tyto dva servery se uživatel přihlašuje. (V současné době si sám zvolí, na který prak se zaloguje). Na těchto strojích je nainstalován klient systému PBS. Uživatel může své úlohy spouštět, rušit, přesouvat ve frontách, vyzvedávat výsledky. Zároveň může provádět další interaktivní činosti jako např. testovat nebo kompilovat své programy. Výhledově bude pro interaktivní činnosti vyhrazeno několik výpočetních uzlů golias.
Changed:
<
<
golias01 - golias162
>
>
golias01 - golias162
 
Changed:
<
<
Toto jsou výpočetní neboli pracovní uzly (tzv. worker nody). Nepatří mezi ně golias 10, 15, 25, 31, 32, 33, 59, 97, 98, 100, 137 a 143. (Pro úplnost golias31 - golias99 jsou aliasy pro goliasx31 - goliasx99). Na těchto strojích systém PBS spouští úlohy. Uživatel by se na ně neměl bezdůvodně hlásit.
>
>
Toto jsou výpočetní neboli pracovní uzly (tzv. worker nody). Nepatří mezi ně golias 10, 15, 25, 31, 32, 33, 59, 97, 98, 100, 137 a 143. (Pro úplnost golias31 - golias99 jsou aliasy pro goliasx31 - goliasx99). Na těchto strojích systém PBS spouští úlohy. Uživatel by se na ně neměl bezdůvodně hlásit.
 
Changed:
<
<
storage.farm.particle.cz
>
>
storage.farm.particle.cz
 
Changed:
<
<
storage2.farm.particle.cz
>
>
storage2.farm.particle.cz
 
Changed:
<
<
storage3.farm.particle.cz
>
>
storage3.farm.particle.cz
 
Changed:
<
<
storage4.farm.particle.cz
>
>
storage4.farm.particle.cz
 
Changed:
<
<
storage5.farm.particle.cz
>
>
storage5.farm.particle.cz
 
Changed:
<
<
Toto jsou fileservery, na kterých jsou uložena data a domovské adresáře. Pomocí NFS jsou namountovány na všech serverech golias a prak jako adresáře /raidN, kde N je číslo v názvu serveru. Pokud je součástí jména adresáře /raidN i jméno experimentu, znamená to, že tento adresář může být využíván pouze pro daný experiment. Soubory uložené v adresáři /raidN se nezálohují! Uživatel si musí soubory sám zkopírovat na jiné místo. Zálohují se pouze domovské adresáře.
>
>
Toto jsou fileservery, na kterých jsou uložena data a domovské adresáře. Pomocí NFS jsou namountovány na všech serverech golias a prak jako adresáře /raidN, kde N je číslo v názvu serveru. Pokud je součástí jména adresáře /raidN i jméno experimentu, znamená to, že tento adresář může být využíván pouze pro daný experiment. Soubory uložené v adresáři /raidN se nezálohují! Uživatel si musí soubory sám zkopírovat na jiné místo. Zálohují se pouze domovské adresáře.
  Podrobnou HW konfiguraci farmy Goliáš naleznete [zde]
Line: 56 to 58
  Domovský adresář /home
Added:
>
>
Zálohování
 Adresář /home je vidět ze všech výpočetních uzlů. Zálohuje se systémem networker. Pokud chce uživatel obnovit ztracený soubor, musí se zalogovat na prak2 nebo prak3 a potom se už bez hesla pomocí ssh přihlásí na storage5.

ssh storage5

Line: 64 to 68
  ...
Changed:
<
<
Prostor domovského adresáře je ale omezen kvótou. Rozlišujeme dva stupně: soft limit a hard limit. V současné době je soft limit nastaven na hodnotu 2GB. Při jeho překročení by uživatel měl obdržet varování. Hard limit je nastaven na hodnotu 2,5GB. Tento limit už překročit nelze.
>
>
Kvóty

Prostor domovského adresáře je ale omezen kvótou. Rozlišujeme dva stupně: soft limit a hard limit. V současné době je soft limit standardně nastaven na hodnotu 2GB, hard limit na hodnotu 2,5GB. Hard limit už překročit nelze.

NEW Při zalogování na prak2 nebo prak3 se uživateli automaticky zobrazí velikost obsazeného prostoru a nastavené kvóty. Uživatel je také upozorněn v případě, že překročil soft limit.

 
Changed:
<
<
Po zalogování na prak2 nebo prak3 si uživatel může zjistit míru zaplnění svého adresáře /home a výši limitů pomocí příkazu
>
>
Míru zaplnění adresáře /home a výši limitů lze také zjistit pomocí příkazu
  ssh storage5 /usr/sbin/repquota -s /home
Line: 86 to 94
  Pokud uživatel potřebuje v adresáři /home větší prostor, může požádat o zvýšení kvóty. Svou žádost náležitě odůvodní a pošle prostřednictvím e-mailu Janu Švecovi nebo Tomáši Koubovi.
Changed:
<
<
Pozn.: V adresáři /home se nachází soubor .rhosts. Tento soubor je nezbytný pro potřeby administrátorů. Nesmí být smazán!
>
>
ALERT! V adresáři /home se nachází soubor .rhosts. Tento soubor je nezbytný pro potřeby administrátorů. Nesmí být smazán!
  Pracovní adresář /scratch

Revision 202 Jul 2008 - FZU.JanaUhlirova

Line: 1 to 1
 
META TOPICPARENT name="VsDokumentace"
Changed:
<
<

Dokumentace pro uživatele farmy Goliáš

>
>

Dokumentace pro uživatele farmy Goliáš

 
Changed:
<
<

1. Základní informace

>
>

Obsah:

 
Changed:
<
<
  1. Struktura farmy Goliáš
  2. Nový uživatel
  3. Adresáře /home a /scratch

2. Zadávání úloh

  1. Typy front
  2. Příkaz qsub
  3. Další užitečné příkazy PBS

3. Práce s certifikátem

  1. Získání certifikátu
  2. Převod do jiných formátů
>
>
 
Changed:
<
<
1.1 Struktura farmy Goliáš
>
>

1. Základní informace

1.1 Struktura farmy Goliáš

  golias.farm.particle.cz
Line: 30 to 20
  prak3.farm.particle.cz
Changed:
<
<
Na tyto dva servery se uživatel přihlašuje. (V současné době si sám zvolí, na který prak se zaloguje). Na těchto strojích je nainstalován klient systému PBS. Uživatel může své úlohy spouštět, rušit, přesouvat ve frontách, vyzvedávat výsledky. Zároveň může provádět další interaktivní činosti jako např. testovat nebo kompilovat své programy. Výhledově bude pro interaktivní činnosti vyhrazeno několik výpočetních uzlů golias.
>
>
Na tyto dva servery se uživatel přihlašuje. (V současné době si sám zvolí, na který prak se zaloguje). Na těchto strojích je nainstalován klient systému PBS. Uživatel může své úlohy spouštět, rušit, přesouvat ve frontách, vyzvedávat výsledky. Zároveň může provádět další interaktivní činosti jako např. testovat nebo kompilovat své programy. Výhledově bude pro interaktivní činnosti vyhrazeno několik výpočetních uzlů golias.
  golias01 - golias162
Line: 52 to 42
  Zpět
Changed:
<
<
1.2 Nový uživatel
>
>

1.2 Nový uživatel

  Každý nový zájemce o používání farmy Goliáš musí vyplnit Žádost o zřízení účtu. Žádost je nutné v papírové formě zaslat na sekretariát Sekce fyziky elementárních částic FZÚ. Pro urychlení celé procedury je možné žádost poslat faxem (fax: 286 585 443) a originál doručit do čtrnácti dnů.
Line: 63 to 52
  Zpět
Changed:
<
<
1.3 Adresáře /home a /scratch
>
>

1.3 Adresáře /home a /scratch

 
Changed:
<
<
Domovský adresář /home
>
>
Domovský adresář /home
  Adresář /home je vidět ze všech výpočetních uzlů. Zálohuje se systémem networker. Pokud chce uživatel obnovit ztracený soubor, musí se zalogovat na prak2 nebo prak3 a potom se už bez hesla pomocí ssh přihlásí na storage5.
Line: 100 to 88
  Pozn.: V adresáři /home se nachází soubor .rhosts. Tento soubor je nezbytný pro potřeby administrátorů. Nesmí být smazán!
Changed:
<
<
Pracovní adresář /scratch
>
>
Pracovní adresář /scratch
 
Changed:
<
<
Na každém výpočetním uzlu je lokální pracovní prostor /scratch. Do tohoto prostoru by se měly ukládat mezivýsledky výpočtů. Při spuštění úlohy se v adresáři /scratch automaticky vytvoří podadresář /pbstmp. cislojobu .golias. Současně se vytvoří proměnná $TMPDIR, která do tohoto adresáře ukazuje. Po skončení úlohy se tento podadresář automaticky smaže. Tímto způsobem se prostor /scratch průběžně promazává. Proto je třeba ve skriptech, kterými se úlohy zadávají do front, používat pro uložení dočasných dat proměnnou $TMPDIR.
>
>
Na každém výpočetním uzlu je lokální pracovní prostor /scratch. Do tohoto prostoru by se měly ukládat mezivýsledky výpočtů. Při spuštění úlohy se v adresáři /scratch automaticky vytvoří podadresář /pbstmp.cislojobu.golias. Současně se vytvoří proměnná $TMPDIR, která do tohoto adresáře ukazuje. Po skončení úlohy se tento podadresář automaticky smaže. Tímto způsobem se prostor /scratch průběžně promazává. Proto je třeba ve skriptech, kterými se úlohy zadávají do front, používat pro uložení dočasných dat proměnnou $TMPDIR.
  Zpět
Changed:
<
<
2.1 Typy front
>
>

2. Zadávání úloh

2.1 Typy front

  Některé fronty jsou vyhrazené pro speciální projekty (experimenty), pro určité skupiny uživatelů nebo pro speciální typ úloh (interaktivní úlohy apod.). Fronty mají při spuštění úloh různou prioritu. Mohou mít také nastavené různé limity. Např.:
Line: 120 to 109
  Původní rozdělení front na farmě Goliáš je následující:
Changed:
<
<
  • fronty experimentů (atlas, d0, alice, star, auger, ... )
>
>
  • fronty experimentů (atlas, d0, alice, star, auger, ... )
 
  • fronty pro uživatele ze Sekce vysokých energií FZÚ nezařazených v jiných projektech (fronty long a short)
  • fronty pro uživatele ze Sekce materiálový výzkum, t.j. pro uživatele subclusteru David (fronty solid a tsolid)
Changed:
<
<
  • fronty testovací (test, lcgtest, ... ).
>
>
  • fronty testovací (test, lcgtest ... ).
 
Changed:
<
<
Fronty experimentů se dále dělí na fronty produkční a fronty neprodukční. Experimenty podporované gridovým projektem mají ještě fronty, jejichž název začíná lcg. Tyto fronty slouží pouze ke spuštění úloh zadaných přes grid.
>
>
Fronty experimentů se dále dělí na fronty produkční a fronty neprodukční. Experimenty podporované gridovým projektem mají ještě fronty, jejichž název začíná lcg. Tyto fronty slouží pouze ke spuštění úloh zadaných přes grid.
  Každý experiment tedy má 2 fronty: produkční a neprodukční nebo 4 fronty: 2 fronty negridové a 2 fronty gridové, dále dělené na produkční a neprodukční.
Changed:
<
<
Např. fronty pro experiment atlas
>
>
Např. fronty pro experiment atlas
 
atlas fronta negridová a neprodukční
atlasprod fronta negridová a produkční
Line: 140 to 129
  Příklad: Fronta q1 má nejvyšší prioritu, fronty q2 a q3 mají vyhrazený počet procesorů a stejnou prioritu. Ve frontě q1 čeká n1 úloh, ve frontě q2 běží m2 úloh a čeká n2 úloh a ve frontě q3 čeká n3 úloh. V okamžiku, kdy se uvolní jeden procesor, systém PBS by spustil úlohu z fronty q1 (nejvyšší priorita), ale vzhledem k tomu, že fronty q2 a q3 ještě nenaplnily svůj počet vyhrazených procesorů, spustí se úloha z fronty q2. Při uvolnění dalšího procesoru se spustí úloha z fronty q3 (stejná priorita). Tento postup se opakuje až do doby, kdy fronty q2 a q3 vyčerpají svůj počet rezervovaných procesorů nebo ve frontách už nečekají další úlohy.
Changed:
<
<
Uživatel zadává svou úlohu do fronty z praku2 nebo z praku3 pomocí příkazu qsub. Nesmí posílat úlohy do front označených lcg a také do front testovacích.
>
>
Uživatel zadává svou úlohu do fronty z praku2 nebo z praku3 pomocí příkazu qsub. Nesmí posílat úlohy do front označených lcg a také do front testovacích.
  Úplný seznam front lze získat po přihlášení na prak2 nebo prak3 pomocí příkazu
Line: 153 to 142
  Zpět
Changed:
<
<
2.2 Příkaz qsub
>
>

2.2 Příkaz qsub

 
Changed:
<
<
Úlohy se zadávají do fronty pomocí příkazu qsub.
>
>
Úlohy se zadávají do fronty pomocí příkazu qsub.
 
Changed:
<
<
qsub -q jméno fronty seznam parametrů váš skript
>
>
qsub -q <jméno fronty> <seznam parametrů> <váš skript>
 
Changed:
<
<
Tabulka parametrů příkazu qsub:
>
>
Tabulka parametrů příkazu qsub:
 
Added:
>
>
Parametr Popis
 
-q jméno fronty
-I interaktivní úloha, podrobnosti zde
-m zaslání e-mailu, není-li specifikováno, žádný e-mail se neposílá
Line: 174 to 164
  Tabulka požadavků úlohy na výpočetní zdroje:
Added:
>
>
pbs_resources Popis
 
nodes/select počet výpočetních uzlů
ppn/ncpus počet procesorů na jednom uzlu
mem velikost fyzické paměti
Line: 183 to 174
  Příklady:
Changed:
<
<
qsub -q jméno fronty -l seznam požadavků na výpočetní zdroje váš skript
>
>
qsub -q <jméno fronty> -l <seznam požadavků na výpočetní zdroje> <váš skript>
 
Changed:
<
<
Chceme rezervovat Specifikace parametru -l
>
>
Chceme rezervovat Specifikace parametru -l
 
1 uzel a 1 procesor nodes=1:ppn=1
select=1:ncpus=1
1 uzel a 2 procesory nodes=1:ppn=2
Line: 203 to 194
  Zpět
Changed:
<
<
2.3 Další užitečné příkazy PBS
>
>

2.3 Další užitečné příkazy PBS

 
Changed:
<
<
  • qdel - vymaže úlohu z fronty
>
>
  • qdel - vymaže úlohu z fronty
 
Changed:
<
<
qdel číslo úlohy
>
>
qdel <číslo úlohy>
 
Changed:
<
<
  • qstat - zobrazí dostupné informace o dané úloze, o dané frontě
>
>
  • qstat - zobrazí dostupné informace o dané úloze, o dané frontě
 
Changed:
<
<
qstat -f číslo úlohy
>
>
qstat -f <číslo úlohy>
 
Changed:
<
<
qstat -a jméno fronty
>
>
qstat -a <jméno fronty>
  Zpět
Changed:
<
<

3. Práce s certifikátem

>
>

3. Práce s certifikátem

 
Changed:
<
<
3.1 Získání certifikátu
>
>

3.1 Získání certifikátu

 Certfikát lze získat od certifikační autority CESNETu, o osobní certifikát se žádá zde.
Changed:
<
<
3.2 Převod do jiných formátů
Certfikát je typicky uložen do internetového prohlížeče. Exportem certifikátu získáme soubor s příponou p12. Pro použití v gridovém prostředí je třeba ho převést do formátu pem příkazy:
>
>

3.2 Převod do jiných formátů

Certfikát je typicky uložen do internetového prohlížeče. Exportem certifikátu získáme soubor s příponou p12. Pro použití v gridovém prostředí je třeba ho převést do formátu pem příkazy:
  openssl pkcs12 -clcerts -nokeys -in usercert.p12 -out usercert.pem

Revision 101 Jul 2008 - FZU.JanaUhlirova

Line: 1 to 1
Added:
>
>
META TOPICPARENT name="VsDokumentace"

Dokumentace pro uživatele farmy Goliáš

1. Základní informace

  1. Struktura farmy Goliáš
  2. Nový uživatel
  3. Adresáře /home a /scratch

2. Zadávání úloh

  1. Typy front
  2. Příkaz qsub
  3. Další užitečné příkazy PBS

3. Práce s certifikátem

  1. Získání certifikátu
  2. Převod do jiných formátů

1.1 Struktura farmy Goliáš

golias.farm.particle.cz

Na tomto stroji běží server systému PBSPro, který má na starosti plánování a spouštění úloh na farmě Goliáš.

prak2.farm.particle.cz

prak3.farm.particle.cz

Na tyto dva servery se uživatel přihlašuje. (V současné době si sám zvolí, na který prak se zaloguje). Na těchto strojích je nainstalován klient systému PBS. Uživatel může své úlohy spouštět, rušit, přesouvat ve frontách, vyzvedávat výsledky. Zároveň může provádět další interaktivní činosti jako např. testovat nebo kompilovat své programy. Výhledově bude pro interaktivní činnosti vyhrazeno několik výpočetních uzlů golias.

golias01 - golias162

Toto jsou výpočetní neboli pracovní uzly (tzv. worker nody). Nepatří mezi ně golias 10, 15, 25, 31, 32, 33, 59, 97, 98, 100, 137 a 143. (Pro úplnost golias31 - golias99 jsou aliasy pro goliasx31 - goliasx99). Na těchto strojích systém PBS spouští úlohy. Uživatel by se na ně neměl bezdůvodně hlásit.

storage.farm.particle.cz

storage2.farm.particle.cz

storage3.farm.particle.cz

storage4.farm.particle.cz

storage5.farm.particle.cz

Toto jsou fileservery, na kterých jsou uložena data a domovské adresáře. Pomocí NFS jsou namountovány na všech serverech golias a prak jako adresáře /raidN, kde N je číslo v názvu serveru. Pokud je součástí jména adresáře /raidN i jméno experimentu, znamená to, že tento adresář může být využíván pouze pro daný experiment. Soubory uložené v adresáři /raidN se nezálohují! Uživatel si musí soubory sám zkopírovat na jiné místo. Zálohují se pouze domovské adresáře.

Podrobnou HW konfiguraci farmy Goliáš naleznete [zde]

Zpět

1.2 Nový uživatel

Každý nový zájemce o používání farmy Goliáš musí vyplnit Žádost o zřízení účtu. Žádost je nutné v papírové formě zaslat na sekretariát Sekce fyziky elementárních částic FZÚ. Pro urychlení celé procedury je možné žádost poslat faxem (fax: 286 585 443) a originál doručit do čtrnácti dnů.

Jakmile obdržíte e-mailem potvrzení o zřízení účtu, je nutné se přihlásit na prak2 a na prak3 a pomocí příkazu passwd změnit přístupové heslo. Heslo by mělo být silné, tzn. mělo by se skládat alespoň z 8 znaků a obsahovat malá a velká písmena, číslice a nealfanumerické znaky (např. %, &, *, # apod.).

Pozn.: Po instalaci systému LDAP bude uživatel při prvním přihlášení na kterýkoliv z praků automaticky vyzván ke změně hesla. Dokud si heslo nezmění, nebude mít možnost dále pracovat.

Zpět

1.3 Adresáře /home a /scratch

Domovský adresář /home

Adresář /home je vidět ze všech výpočetních uzlů. Zálohuje se systémem networker. Pokud chce uživatel obnovit ztracený soubor, musí se zalogovat na prak2 nebo prak3 a potom se už bez hesla pomocí ssh přihlásí na storage5.

ssh storage5

nwrecover&

...

Prostor domovského adresáře je ale omezen kvótou. Rozlišujeme dva stupně: soft limit a hard limit. V současné době je soft limit nastaven na hodnotu 2GB. Při jeho překročení by uživatel měl obdržet varování. Hard limit je nastaven na hodnotu 2,5GB. Tento limit už překročit nelze.

Po zalogování na prak2 nebo prak3 si uživatel může zjistit míru zaplnění svého adresáře /home a výši limitů pomocí příkazu

ssh storage5 /usr/sbin/repquota -s /home

Block limits File limits
User used soft hard grace used soft hard grace
xxx n 1954M 2442M m 0 0

n - velikost obsazeného prostoru (v kB)

block limits - limity omezující obsazený prostor (v MB)

file limits - limity omezující počet uložených souborů (tyto limity nejsou nastavené)

grace - doba, po kterou může být překročen soft limit (standardní nastavení je 7 dnů)

Zvýšení kvóty

Pokud uživatel potřebuje v adresáři /home větší prostor, může požádat o zvýšení kvóty. Svou žádost náležitě odůvodní a pošle prostřednictvím e-mailu Janu Švecovi nebo Tomáši Koubovi.

Pozn.: V adresáři /home se nachází soubor .rhosts. Tento soubor je nezbytný pro potřeby administrátorů. Nesmí být smazán!

Pracovní adresář /scratch

Na každém výpočetním uzlu je lokální pracovní prostor /scratch. Do tohoto prostoru by se měly ukládat mezivýsledky výpočtů. Při spuštění úlohy se v adresáři /scratch automaticky vytvoří podadresář /pbstmp. cislojobu .golias. Současně se vytvoří proměnná $TMPDIR, která do tohoto adresáře ukazuje. Po skončení úlohy se tento podadresář automaticky smaže. Tímto způsobem se prostor /scratch průběžně promazává. Proto je třeba ve skriptech, kterými se úlohy zadávají do front, používat pro uložení dočasných dat proměnnou $TMPDIR.

Zpět

2.1 Typy front

Některé fronty jsou vyhrazené pro speciální projekty (experimenty), pro určité skupiny uživatelů nebo pro speciální typ úloh (interaktivní úlohy apod.). Fronty mají při spuštění úloh různou prioritu. Mohou mít také nastavené různé limity. Např.:

  • maximální počet úloh, které mohou být z dané fronty spuštěné zároveň
  • maximální množství skutečného času, po který může úloha běžet
  • maximální počet uzlů, které může úloha nárokovat
  • maximální množství paměti, kterou může úloha využít.
Při překročení některého z limitů se úloha nespustí nebo je předčasně ukončena.

Původní rozdělení front na farmě Goliáš je následující:

  • fronty experimentů (atlas, d0, alice, star, auger, ... )
  • fronty pro uživatele ze Sekce vysokých energií FZÚ nezařazených v jiných projektech (fronty long a short)
  • fronty pro uživatele ze Sekce materiálový výzkum, t.j. pro uživatele subclusteru David (fronty solid a tsolid)
  • fronty testovací (test, lcgtest, ... ).

Fronty experimentů se dále dělí na fronty produkční a fronty neprodukční. Experimenty podporované gridovým projektem mají ještě fronty, jejichž název začíná lcg. Tyto fronty slouží pouze ke spuštění úloh zadaných přes grid.

Každý experiment tedy má 2 fronty: produkční a neprodukční nebo 4 fronty: 2 fronty negridové a 2 fronty gridové, dále dělené na produkční a neprodukční.

Např. fronty pro experiment atlas

atlas fronta negridová a neprodukční
atlasprod fronta negridová a produkční
lcgatlas fronta gridová a neprodukční
lcgatlasprod fronta gridová a produkční

Priority: Úlohy zadané do produkční fronty mají vyšší prioritu než úlohy zadané do fronty neprodukční. Stejně tak fronta short, určená pro kratší úlohy, které nepoběží déle než 4 hodiny, má vyšší prioritu než fronta long, určená pro úlohy časově náročnější. Tedy v případě, že v obou frontách čekají úlohy, po uvolnění procesoru se nejdříve spustí úloha z fronty s vyšší prioritou. Avšak není to tak jednoduché. Kromě priorit se uplatňují ještě další omezení. Ta by měla zaručit co nejoptimálnější využití farmy. Výjimku tvoří fronty s vyhrazeným počtem procesorů.

Příklad: Fronta q1 má nejvyšší prioritu, fronty q2 a q3 mají vyhrazený počet procesorů a stejnou prioritu. Ve frontě q1 čeká n1 úloh, ve frontě q2 běží m2 úloh a čeká n2 úloh a ve frontě q3 čeká n3 úloh. V okamžiku, kdy se uvolní jeden procesor, systém PBS by spustil úlohu z fronty q1 (nejvyšší priorita), ale vzhledem k tomu, že fronty q2 a q3 ještě nenaplnily svůj počet vyhrazených procesorů, spustí se úloha z fronty q2. Při uvolnění dalšího procesoru se spustí úloha z fronty q3 (stejná priorita). Tento postup se opakuje až do doby, kdy fronty q2 a q3 vyčerpají svůj počet rezervovaných procesorů nebo ve frontách už nečekají další úlohy.

Uživatel zadává svou úlohu do fronty z praku2 nebo z praku3 pomocí příkazu qsub. Nesmí posílat úlohy do front označených lcg a také do front testovacích.

Úplný seznam front lze získat po přihlášení na prak2 nebo prak3 pomocí příkazu

qstat -q

Pozn.: Po instalaci systému LDAP proběhne přeregistrování všech uživatelů, vytvoří se nové uživatelské skupiny a v důsledku toho se také změní současná struktura front.

...

Zpět

2.2 Příkaz qsub

Úlohy se zadávají do fronty pomocí příkazu qsub.

qsub -q jméno fronty seznam parametrů váš skript

Tabulka parametrů příkazu qsub:

-q jméno fronty
-I interaktivní úloha, podrobnosti zde
-m zaslání e-mailu, není-li specifikováno, žádný e-mail se neposílá
a (abort) – zpráva o přerušení úlohy
b (begin) – zpráva o spuštění úlohy
e (end) – zpráva o ukončení úlohy
-o kam uložit výstupní soubor stdout , není-li specifikováno, stdout se automaticky ukládá do adresáře, ze kterého byl spuštěn příkaz qsub
-e kam uložit chybový soubor stderr , není-li specifikováno, stderr se automaticky ukládá do adresáře, ze kterého byl spuštěn příkaz qsub
-l seznam požadavků na výpočetní zdroje

Tabulka požadavků úlohy na výpočetní zdroje:

nodes/select počet výpočetních uzlů
ppn/ncpus počet procesorů na jednom uzlu
mem velikost fyzické paměti
vmem velikost virtuální paměti
walltime množství skutečného času
cput množství času CPU

Příklady:

qsub -q jméno fronty -l seznam požadavků na výpočetní zdroje váš skript

Chceme rezervovat Specifikace parametru -l
1 uzel a 1 procesor nodes=1:ppn=1
select=1:ncpus=1
1 uzel a 2 procesory nodes=1:ppn=2
select=1:ncpus=2
2 uzly a na každém 1 procesor nodes=2:ppn=1
select=2:ncpus=1
1 uzel a 1 procesor na 100 hodin skutečného času a paměť 200MB nodes=1:ppn=1,walltime=100:00:00,mem=200mb
select=1:ncpus=1:walltime=100:00:00:mem=200mb
1 uzel se 2 procesory, na každém procesoru paměť 3GB nodes=1:ppn=2,mem=3gb
select=1:ncpus=2:mem=3GB
2 uzly, na každém 1 procesor s pamětí 500MB nodes=2:ppn=1,mem=500mb
select=2:ncpus=1:mem=500mb

...

Zpět

2.3 Další užitečné příkazy PBS

  • qdel - vymaže úlohu z fronty

qdel číslo úlohy

  • qstat - zobrazí dostupné informace o dané úloze, o dané frontě

qstat -f číslo úlohy

qstat -a jméno fronty

Zpět

3. Práce s certifikátem

3.1 Získání certifikátu
Certfikát lze získat od certifikační autority CESNETu, o osobní certifikát se žádá zde.

3.2 Převod do jiných formátů
Certfikát je typicky uložen do internetového prohlížeče. Exportem certifikátu získáme soubor s příponou p12. Pro použití v gridovém prostředí je třeba ho převést do formátu pem příkazy:

openssl pkcs12 -clcerts -nokeys -in usercert.p12 -out usercert.pem

openssl pkcs12 -nocerts -in usercert.p12 -out userkey.pem

Zpět

-- JanaUhlirova - 01 Jul 2008

 
This site is powered by the TWiki collaboration platformCopyright &Š by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback