FAQs - Časté dotazy uživatelů
Pro snažší komunikaci s uživateli byl zaveden
RT (Request Tracking) system . Proto veškeré dotazy a problémy spojené s farmou Goliáš zasílejte výhradně na e-mailovou adresu
fzu zavináč rt3.cesnet.cz .
Upozornění:
Dne 19.11.2008 byl definitivně vypnut server
prak2.farm.particle.cz.
Seznam otázek
1. Nový uživatel
Jak mám zažádat o zřízení účtu na farmě Goliáš?
A: Pokud chcete pracovat na farmě Goliáš, musíte vyplnit
Žádost o zřízení účtu. Žádost podepsanou Vašim nadřízeným zašlete v papírové formě na sekretariát Sekce fyziky elementárních částic FZÚ. Pro urychlení celé procedury můžete žádost poslat faxem (fax: 286 585 443) a originál doručit do čtrnácti dnů.
Zpět
Na které stroje se můžu přihlašovat?
A: Přihlašujete se pouze na stroje
ui2.farm.particle.cz a
prak3.farm.particle.cz. V současné době si sami zvolíte, na který stroj se zalogujete.
Pozn.: Struktura farmy Goliáš je stručně popsána
zde.
Zpět
Jak změním svoje přístupové heslo?
A: Pokud jste nový uživatel, musíte si heslo změnit ihned, jakmile e-mailem obdržíte potvrzení o zřízení účtu. Přihlašte se na
golias.farm.particle.cz a potom na
ui2.farm.particle.cz nebo na
prak3.farm.particle.cz a pomocí příkazu
passwd si heslo změňte.
Heslo by mělo být silné, tzn. mělo by se skládat alespoň z 8 znaků a obsahovat malá a velká písmena, číslice a nealfanumerické znaky (např. %, &, *, # apod.).
Pozn.: Po dokončení instalaci systému
LDAP (
Lightweight Directory Access Protocol ) bude každý nový uživatel při prvním přihlášení na
ui2 nebo
prak3 automaticky vyzván ke změně svého hesla. Dokud si heslo nezmění, nebude mít možnost dále pracovat.
Vzhledem k tomu, že systém
LDAP ještě není nainstalován na všech uzlech, uživatelská data se zatím berou z
goliase. Pokud si tedy heslo změníte na libovolném ldapizovaném uzlu, změní se automaticky na ostatních ldapizovaných uzlech, ale nejpozději do jedné hodiny se přepíše heslem nastaveným na
goliasi. Proto změnu hesla musíte také provést na
goliasi.
Heslo si můžete měnit podle vlastního uvážení. Zatím nejsou stanovené žádné časové lhůty.
Zpět
2. Datové prostory
Jaké datové prostory jsou na farmě Goliáš k dispozici?
A: Uživatel má k dispozici domovský adresář
/home a lokální pracovní adresář
/scratch.
- Domovský adresář /home je vidět ze všech výpočetních uzlů. Je zálohován, jeho prostor je ale omezen kvótou.
- Lokální pracovní adresář /scratch existuje na každém výpočetním uzlu. Je vhodné ho používat pro ukládání mezivýsledků výpočtů, protože je k němu rychlejší přístup. Průběžně se promazává, není omezen kvótou. Podrobnosti zde.
Zpět
Jaké jsou v adresáři /home limity?
A: Rozlišujeme dva stupně limitu:
soft limit a
hard limit. V současné době je soft limit standardně nastaven na hodnotu
2GB, hard limit na hodnotu
2,5GB. Výhledově při překročení soft limitu obdržíte upozornění prostřednictvím e-mailu. Hard limit už překročit nemůžete. Data se přestanou zapisovat.
Zpět
Jak zjistím, kolik mám ještě v adresáři /home volného místa?
A: Míru zaplnění adresáře
/home a výši limitů lze zjistit po zalogování na
ui2 nebo
prak3 pomocí příkazu
ssh storage5 /usr/sbin/repquota -s /home
Podrobnější informace naleznete
zde.
Zpět
Jak mám požádat o zvýšení limitu?
A: Pokud potřebujete v adresáři
/home větší prostor, můžete požádat o zvýšení kvóty. Svou žádost náležitě odůvodněte a pošlete prostřednictvím e-mailu Janu Švecovi nebo Tomáši Koubovi.
Zpět
Které soubory jsou zálohované?
A: Zálohuje se pouze domovský adresář
/home, a to pomocí systému
Legato Net Worker. Zálohy se zapisují na pásky o velikosti 400 GB (bez komprese). Každou noc se provádí inkrementální záloha a jednou za měsíc plná záloha. V současné době se uchovávají 4 verze plných záloh, tj. data jsou přístupná s minimálně 3 měsíční historií.
Zpět
Jak můžu obnovit ztracený soubor?
A: V případě, že chcete obnovit smazaný soubor, musíte se přihlásit na
ui2 nebo
prak3 pomocí
ssh -X a potom se už bez hesla zalogovat na
storage5
ssh storage5
a zadat příkaz
nwrecover &
Dostanete grafické
GUI k obnově.
Podrobnější informace naleznete
zde.
Zpět
3. Zadávání úloh do fronty
Do jaké fronty mám úlohy posílat?
A: Úplný seznam front získáte po přihlášení na
ui2 nebo
prak3 pomocí příkazu
qstat -q
Základní informace o rozdělení front naleznete
zde.
Úlohy se nesmí posílat do front označených
lcg a také do front testovacích.
Zpět
Jakým způsobem se úloha do fronty zadává?
A: Úloha je v zásadě
skript, který si předem připravíte a potom zadáte do fronty pomocí příkazu
qsub. Příkaz vrátí
Job ID.
qsub -q <jméno fronty> <seznam parametrů> <váš skript>
1234567.golias
- Skript se spouští ve vašem domovském adresáři. Proto je třeba u všech příkazů, které nejsou v domovském adresáři, použít plnou cestu nebo příkaz cd.
- Při spuštění úlohy se v pracovním adresáři /scratch automaticky vytvoří podadresář /pbstmp.cislojobu.golias. Současně se vytvoří proměnná $TMPDIR, která do tohoto adresáře ukazuje. Proto je třeba ve skriptu pro uložení dočasných dat použít proměnnou $TMPDIR. Podadresář se po skončení úlohy automaticky smaže.
V seznamu parametrů můžete např. specifikovat přepínačem:
- -m o jakých událostech dostávat e-mail
- -o kam uložit výstupní soubor stdout (standardně se stdout ukládá do adresáře, ze kterého byl spuštěn příkaz qsub)
- -e kam uložit chybový soubor stderr (standardně se stderr ukládá do adresáře, ze kterého byl spuštěn příkaz qsub)
- -l požadavky úlohy na
- vlastnosti uzlu (např. typ model=, operační systém bits=, ... )
- zdroje (např. počet uzlů select= , počet procesorů na jednom uzlu ncpus=, množství skutečného času walltime=, velikost paměti mem=, ... )
Úplný seznam vlastností a zdrojů naleznete na manuálové stránce
man pbs_resources
Podrobné informace o příkazu
qsub jsou
zde nebo na manuálové stránce
man qsub
Zpět
Chci dostávat e-mailem informaci o případném přerušení úlohy.
A: Nejprve si v domovském adresáři
/home vytvořte soubor
.forward a do něho napište seznam e-mailových adres, na které chcete zprávy posílat.
V příkazu
qsub si pomocí parametru
-m zvolte, o jakých událostech chcete dostávat e-mail:
- a (abort) zpráva o přerušení úlohy
- b (begin) zpráva o spuštění úlohy
- e (end) zpráva o ukončení úlohy
Např. chcete-li zprávu o spuštění, ukončení i případném přerušení úlohy, zadáte
qsub -q <jméno fronty>
-m abe [
-l <seznam požadavků na výpočetní zdroje>] <váš skript>
Pozn.: Pokud nemáte vytvořený soubor
.forward, můžete e-mailovou adresu specifikovat přímo v příkazu
qsub dalším parametrem
-M <e-mailová adresa>.
qsub -q <jméno fronty>
-m abe -M <e-mailová adresa> [
-l <seznam požadavků na výpočetní zdroje>] <váš skript>
Zpět
Jak si mám rezervovat dva výpočetní uzly a na každém dva procesory?
A: Požadavky úlohy na výpočetní uzly se zadávájí pomocí tzv. chunků. Každý chunk obsahuje seznam požadavků na jeden výpočetní uzel. Jednotlivé požadavky jsou oddělené dvojtečkou ve tvaru
<resource_name=hodnota>. Kromě obsahu chunku uživatel specifikuje i jejich počet
N.
-l select=[N:] chunk [+[N:] chunk ...]
Pokud
N není uvedeno, dosadí se automaticky hodnota 1.
Počet požadovaných procesorů na jednom uzlu se zadává specifikací
ncpus. Dva výpočetní uzly a na každém dva procesory zadáte specifikací
qsub -q <jméno fronty>
-l select=2:ncpus=2 <váš skript>
Zpět
Jak si mám rezervovat jeden výpočetní uzel se třemi procesory na 100 hodin skutečného času?
A: Požadavek na množství skutečného času se zadává specifikací
walltime. Tento požadavek patří mezi tzv.
job-wide limits, limity, které úloha požaduje jako celek. (Na rozdíl od tzv.
per-chunk limits, limitů, které úloha požaduje na jeden výpočetní uzel).
Job-wide limits jsou v příkazu
qsub vypsány samostatně s parametrem
-l, tzn. nezařazují se do výčtu chunků
-l select= ....
qsub -q <jméno fronty>
-l walltime=100:00:00 -l select=1:ncpus=3 <váš skript>
Zpět
Jak mám spustit úlohu na konkretnim stroji (např. na stroji typu bl35p s 64bitovým OS)?
A: Požadavky na vlastnosti výpočetního uzlu se zadávají specifikací parametrů
model a
bits v rámci tzv. chunků (
-l select= ... ).
qsub -q <jméno fronty>
-l select=1:model=bl35p:bits=64bit <váš skript>
Zpět
Jak mám spustit úlohu náročnou na paměť?
A: Úlohu náročnou na paměť je vhodné spustit na jednom samostatném výpočetním uzlu. Vyhrazení uzlu se zadává specifikací
-l place=excl. Na daném uzlu tedy poběží jedna jediná úloha i v případě, že nejsou obsazené všechny procesory.
qsub -q <jméno fronty>
-l select=1 -l place=excl <váš skript>
Zpět
Jak se zadává interaktivní úloha?
A: Interaktivní úloha je určena především pro ladění a překlady programů. Spustí se pomocí přepínače
-I. Získáte prompt shellu na přiděleném výpočetním uzlu. Z terminálu můžete zadávat příkazy. Po ukončení shellu bude úloha zrušena.
qsub -I -q <jméno fronty> [-l <seznam požadavků na výpočetní zdroje>]
qsub: waiting for job 1234567.golias to start
qsub: job 1234567.golias ready
[user@goliasN ~]$ ... příkazy ...
[user@goliasN ~]$ exit
logout
qsub: job 1234567.golias completed
Zpět
Může se na výpočetním uzlu, který je ve stavu offline, spustit úloha?
A: Memůže. Na výpočetním uzlu, který je ve stavu
offline, se žádná další úloha nespustí. Pouze doběhnou úlohy, které na něm už běží.
Zpět
4. Ostatní
Proč hodnota walltime neodpovídá skutečnému času?
A: Kvůli efektivnějšímu fungování
fairshare (automatické přidělování výpočetních zdrojů na základě propočítaného času) byly u všech výpočetních uzlů nastaveny multiplikátory, kterými je násoben jednak
cput - čas, který úloha zabrala na daném procesoru, jednak
walltime - skutečný čas, po který úloha obsazovala výpočetní uzel. Multiplikátory vyjadřují poměr výkonu daného výpočetního uzlu vůči referenci, kterou je stroj typu dl140. Proto hodnoty
cput a
walltime uvedené pro danou úlohu neodpovídají skutečným hodnotám. Je třeba si je příslušným multiplikátorem přepočítat.
Přehled multiplikátorů pro různé typy strojů je uveden
zde.
Zpět
Jak si mám změnit login shell?
A: Přihlašte se na
golias.farm.particle.cz a pomocí příkazu
chsh si změňte login shell. Do půl hodiny změna automaticky proběhne i na strojich
ui2 a
prak3.
Zpět
...
-
JanaUhlirova - 01 Jul 2008