FAQs - Časté dotazy uživatelů
Pro snažší komunikaci s uživateli byl zaveden
RT (Request Tracking) system . Proto veškeré dotazy a problémy spojené s farmou Goliáš zasílejte výhradně na e-mailovou adresu
fzu zavináč rt3.cesnet.cz .
Novinky:

Dne 29.7. 2008 byla nainstalována
nová verze systému
PBSPro 9.2. Uživatelský manuál
PBSProUserGuide9.2 lze stáhnout
zde
Seznam otázek
1. Nový uživatel
Jak mám zažádat o zřízení účtu na farmě Goliáš?
A: Pokud chcete pracovat na farmě Goliáš, musíte vyplnit
Žádost o zřízení účtu. Žádost podepsanou Vašim nadřízeným zašlete v papírové formě na sekretariát Sekce fyziky elementárních částic FZÚ. Pro urychlení celé procedury můžete žádost poslat faxem (fax: 286 585 443) a originál doručit do čtrnácti dnů.
Zpět
Na které stroje se můžu přihlašovat?
A: Přihlašujete se pouze na stroje
ui2.farm.particle.cz a
prak3.farm.particle.cz. V současné době si sami zvolíte, na který stroj se zalogujete.
Pozn.: Struktura farmy Goliáš je stručně popsána
zde.
Zpět
Jak často mám měnit přístupové heslo?
A: Jakmile obdržíte e-mailem potvrzení o zřízení účtu, je nutné se přihlásit na
ui2 nebo na
prak3 a pomocí příkazu
passwd změnit přístupové heslo. Téměř na všech výpočetních uzlech už je nainstalován systém
LDAP (Lightweight Directory Access Protocol), proto stačí změnu provést jen na jednom uzlu, na ostatních ldapizovaných uzlech se heslo změní automaticky. (Neplatí pro
prak2. Tam je třeba heslo změnit samostatně).
Heslo by mělo být silné, tzn. mělo by se skládat alespoň z 8 znaků a obsahovat malá a velká písmena, číslice a nealfanumerické znaky (např. %, &, *, # apod.).
Heslo si můžete měnit podle vlastního uvážení.
Pozn.: Po instalaci systému
LDAP bude každý nový uživatel při prvním přihlášení na
ui2 nebo
prak3 automaticky vyzván ke změně hesla. Dokud si heslo nezmění, nebude mít možnost dále pracovat.
Zpět
2. Datové prostory
Jaké datové prostory jsou na farmě Goliáš k dispozici?
A: Uživatel má k dispozici domovský adresář
/home a lokální pracovní adresář
/scratch.
- Domovský adresář /home je vidět ze všech výpočetních uzlů. Je zálohován, jeho prostor je ale omezen kvótou.
- Lokální pracovní adresář /scratch existuje na každém výpočetním uzlu. Je vhodné ho používat pro ukládání mezivýsledků výpočtů, protože je k němu rychlejší přístup. Průběžně se promazává, není omezen kvótou. Podrobnosti zde.
Zpět
Jaké jsou v adresáři /home limity?
A: Rozlišujeme dva stupně limitu:
soft limit a
hard limit. V současné době je soft limit standardně nastaven na hodnotu
2GB, hard limit na hodnotu
2,5GB. Výhledově při překročení soft limitu obdržíte upozornění prostřednictvím e-mailu. Hard limit už překročit nemůžete. Data se přestanou zapisovat.
Zpět
Jak zjistím, kolik mám ještě v adresáři /home volného místa?
A: Míru zaplnění adresáře
/home a výši limitů lze zjistit po zalogování na
ui2 nebo
prak3 pomocí příkazu
ssh storage5 /usr/sbin/repquota -s /home
Podrobnější informace naleznete
zde.
Pozn.: Při zalogování na
prak2 se automaticky zobrazí velikost obsazeného prostoru a nastavené kvóty. Budete také upozorněn v případě, že jste už překročil soft limit. Toto řešení je ale pouze dočasné. Výhledově bude uživatel upozorněn na překročení soft limitu e-mailem.
Zpět
Jak mám požádat o zvýšení limitu?
A: Pokud potřebujete v adresáři
/home větší prostor, můžete požádat o zvýšení kvóty. Svou žádost náležitě odůvodněte a pošlete prostřednictvím e-mailu Janu Švecovi nebo Tomáši Koubovi.
Zpět
Které soubory jsou zálohované?
A: Zálohuje se pouze domovský adresář
/home, a to pomocí systému
Legato Net Worker. Zálohy se zapisují na pásky o velikosti 400 GB (bez komprese). Kažou noc se provádí inkrementální záloha a jednou za měsíc plná záloha. Uchovávají se 4 verze plných záloh, tj. data jsou přístupná s minimálně 3 měsíční historií.
Zpět
Jak můžu obnovit ztracený soubor?
A: V případě, že chcete obnovit smazaný soubor, musíte se přihlásit na
ui2 nebo
prak3 pomocí
ssh -X a potom se už bez hesla zalogovat na
storage5
ssh storage5
a zadat příkaz
nwrecover &
Dostanete grafické
GUI k obnově.
Podrobnější informace naleznete
zde.
Zpět
3. Zadávání úloh do fronty
Do jaké fronty mám úlohy posílat?
A: Úplný seznam front získáte po přihlášení na
ui2 nebo
prak3 pomocí příkazu
qstat -q
Základní informace o rozdělení front naleznete
zde.
Úlohy se nesmí posílat do front označených
lcg a také do front testovacích.
Zpět
Jakým způsobem se úloha do fronty zadává?
A: Úloha je v zásadě
skript, který si předem připravíte a potom zadáte do fronty pomocí příkazu
qsub. Příkaz vrátí
Job ID.
qsub -q <jméno fronty> <seznam parametrů> <váš skript>
1234567.golias
- Skript se spouští ve vašem domovském adresáři. Proto je třeba u všech příkazů, které nejsou v domovském adresáři, použít plnou cestu nebo příkaz cd.
- Při spuštění úlohy se v pracovním adresáři /scratch automaticky vytvoří podadresář /pbstmp.cislojobu.golias. Současně se vytvoří proměnná $TMPDIR, která do tohoto adresáře ukazuje. Proto je třeba ve skriptu pro uložení dočasných dat použít proměnnou $TMPDIR. Podadresář se po skončení úlohy automaticky smaže.
V seznamu parametrů můžete např. specifikovat přepínačem:
- -m o jakých událostech dostávat e-mail
- -o kam uložit výstupní soubor stdout (standardně se stdout ukládá do adresáře, ze kterého byl spuštěn příkaz qsub)
- -e kam uložit chybový soubor stderr (standardně se stderr ukládá do adresáře, ze kterého byl spuštěn příkaz qsub)
- -l požadavky úlohy na
- vlastnosti uzlu (např. typ model=, operační systém bits=, ... )
- zdroje (např. počet uzlů select= , počet procesorů na jednom uzlu ncpus=, množství skutečného času walltime=, velikost paměti mem=, ... )
Úplný seznam vlastností a zdrojů naleznete na manuálové stránce
man pbs_resources
Podrobné informace o příkazu
qsub jsou
zde nebo na manuálové stránce
man qsub
Zpět
Chci dostávat e-mailem informaci o případném přerušení úlohy.
A: Nejprve si v domovském adresáři
/home vytvořte soubor
.forward a do něho napište seznam e-mailových adres, na které chcete zprávy posílat.
V příkazu
qsub si pomocí parametru
-m zvolte, o jakých událostech chcete dostávat e-mail:
- a (abort) zpráva o přerušení úlohy
- b (begin) zpráva o spuštění úlohy
- e (end) zpráva o ukončení úlohy
Např. chcete-li zprávu o spuštění, ukončení i případném přerušení úlohy, zadáte
qsub -q <jméno fronty>
-m abe [
-l <seznam požadavků na výpočetní zdroje>] <váš skript>
Pozn.: Pokud nemáte vytvořený soubor
.forward, můžete e-mailovou adresu specifikovat přímo v příkazu
qsub dalším parametrem
-M <e-mailová adresa>.
qsub -q <jméno fronty>
-m abe -M <e-mailová adresa> [
-l <seznam požadavků na výpočetní zdroje>] <váš skript>
Zpět
Jak si mám rezervovat dva výpočetní uzly a na každém dva procesory?
A: Požadavky úlohy na výpočetní uzly se zadávájí pomocí tzv. chunků. Každý chunk obsahuje seznam požadavků na jeden výpočetní uzel. Jednotlivé požadavky jsou oddělené dvojtečkou ve tvaru
<resource_name=hodnota>. Kromě obsahu chunku uživatel specifikuje i jejich počet
N.
-l select=[N:] chunk [+[N:] chunk ...]
Pokud
N není uvedeno, dosadí se automaticky hodnota 1.
Počet požadovaných procesorů na jednom uzlu se zadává specifikací
ncpus. Dva výpočetní uzly a na každém dva procesory zadáte specifikací
qsub -q <jméno fronty>
-l select=2:ncpus=2 <váš skript>
Zpět
Jak si mám rezervovat jeden výpočetní uzel se třemi procesory na 100 hodin skutečného času?
A: Požadavek na množství skutečného času se zadává specifikací
walltime. Tento požadavek patří mezi tzv.
job-wide limits, limity, které úloha požaduje jako celek. (Na rozdíl od tzv.
per-chunk limits, limitů, které úloha požaduje na jeden výpočetní uzel).
Job-wide limits jsou v příkazu
qsub vypsány samostatně s parametrem
-l, tzn. nezařazují se do výčtu chunků
-l select= ....
qsub -q <jméno fronty>
-l walltime=100:00:00 -l select=1:ncpus=3 <váš skript>
Zpět
Jak mám spustit úlohu na konkretnim stroji (např. na stroji typu bl35p s 64bitovým OS)?
A: Požadavky na vlastnosti výpočetního uzlu se zadávají specifikací parametrů
model a
bits v rámci tzv. chunků (
-l select= ... ).
qsub -q <jméno fronty>
-l select=1:model=bl35p:bits=64bit <váš skript>
Zpět
Jak mám spustit úlohu náročnou na paměť?
A: Úlohu náročnou na paměť je vhodné spustit na jednom samostatném výpočetním uzlu. Vyhrazení uzlu se zadává specifikací
-l place=excl. Na daném uzlu tedy poběží jedna jediná úloha i v případě, že nejsou obsazené všechny procesory.
qsub -q <jméno fronty>
-l select=1 -l place=excl <váš skript>
Zpět
Jak se zadává interaktivní úloha?
A: Interaktivní úloha je určena především pro ladění a překlady programů. Spustí se pomocí přepínače
-I. Získáte prompt shellu na přiděleném výpočetním uzlu. Z terminálu můžete zadávat příkazy. Po ukončení shellu bude úloha zrušena.
qsub -I -q <jméno fronty> [-l <seznam požadavků na výpočetní zdroje>]
qsub: waiting for job 1234567.golias to start
qsub: job 1234567.golias ready
[user@goliasN ~]$ ... příkazy ...
[user@goliasN ~]$ exit
logout
qsub: job 1234567.golias completed
Zpět
...
-
JanaUhlirova - 01 Jul 2008