r18 - 20 Nov 2008 - 10:10:52 - JanaUhlirovaYou are here: TWiki  >  VS Web > VsDokumentace > VsFAQ

FAQs - Časté dotazy uživatelů

Pro snažší komunikaci s uživateli byl zaveden RT (Request Tracking) system . Proto veškeré dotazy a problémy spojené s farmou Goliáš zasílejte výhradně na e-mailovou adresu fzu zavináč rt3.cesnet.cz .

Upozornění:

ALERT! Dne 19.11.2008 byl definitivně vypnut server prak2.farm.particle.cz.

Seznam otázek

1. Nový uživatel

Jak mám zažádat o zřízení účtu na farmě Goliáš?

A: Pokud chcete pracovat na farmě Goliáš, musíte vyplnit Žádost o zřízení účtu. Žádost podepsanou Vašim nadřízeným zašlete v papírové formě na sekretariát Sekce fyziky elementárních částic FZÚ. Pro urychlení celé procedury můžete žádost poslat faxem (fax: 286 585 443) a originál doručit do čtrnácti dnů.

Zpět

Na které stroje se můžu přihlašovat?

A: Přihlašujete se pouze na stroje ui2.farm.particle.cz a prak3.farm.particle.cz. V současné době si sami zvolíte, na který stroj se zalogujete.

Pozn.: Struktura farmy Goliáš je stručně popsána zde.

Zpět

Jak změním svoje přístupové heslo?

A: Pokud jste nový uživatel, musíte si heslo změnit ihned, jakmile e-mailem obdržíte potvrzení o zřízení účtu. Přihlašte se na golias.farm.particle.cz a potom na ui2.farm.particle.cz nebo na prak3.farm.particle.cz a pomocí příkazu passwd si heslo změňte. Heslo by mělo být silné, tzn. mělo by se skládat alespoň z 8 znaků a obsahovat malá a velká písmena, číslice a nealfanumerické znaky (např. %, &, *, # apod.).

Pozn.: Po dokončení instalaci systému LDAP ( Lightweight Directory Access Protocol ) bude každý nový uživatel při prvním přihlášení na ui2 nebo prak3 automaticky vyzván ke změně svého hesla. Dokud si heslo nezmění, nebude mít možnost dále pracovat.

Vzhledem k tomu, že systém LDAP ještě není nainstalován na všech uzlech, uživatelská data se zatím berou z goliase. Pokud si tedy heslo změníte na libovolném ldapizovaném uzlu, změní se automaticky na ostatních ldapizovaných uzlech, ale nejpozději do jedné hodiny se přepíše heslem nastaveným na goliasi. Proto změnu hesla musíte také provést na goliasi. Heslo si můžete měnit podle vlastního uvážení. Zatím nejsou stanovené žádné časové lhůty.

Zpět

2. Datové prostory

Jaké datové prostory jsou na farmě Goliáš k dispozici?

A: Uživatel má k dispozici domovský adresář /home a lokální pracovní adresář /scratch.

  • Domovský adresář /home je vidět ze všech výpočetních uzlů. Je zálohován, jeho prostor je ale omezen kvótou.
  • Lokální pracovní adresář /scratch existuje na každém výpočetním uzlu. Je vhodné ho používat pro ukládání mezivýsledků výpočtů, protože je k němu rychlejší přístup. Průběžně se promazává, není omezen kvótou. Podrobnosti zde.

Zpět

Jaké jsou v adresáři /home limity?

A: Rozlišujeme dva stupně limitu: soft limit a hard limit. V současné době je soft limit standardně nastaven na hodnotu 2GB, hard limit na hodnotu 2,5GB. Výhledově při překročení soft limitu obdržíte upozornění prostřednictvím e-mailu. Hard limit už překročit nemůžete. Data se přestanou zapisovat.

Zpět

Jak zjistím, kolik mám ještě v adresáři /home volného místa?

A: Míru zaplnění adresáře /home a výši limitů lze zjistit po zalogování na ui2 nebo prak3 pomocí příkazu

ssh storage5 /usr/sbin/repquota -s /home

Podrobnější informace naleznete zde.

Zpět

Jak mám požádat o zvýšení limitu?

A: Pokud potřebujete v adresáři /home větší prostor, můžete požádat o zvýšení kvóty. Svou žádost náležitě odůvodněte a pošlete prostřednictvím e-mailu Janu Švecovi nebo Tomáši Koubovi.

Zpět

Které soubory jsou zálohované?

A: Zálohuje se pouze domovský adresář /home, a to pomocí systému Legato Net Worker. Zálohy se zapisují na pásky o velikosti 400 GB (bez komprese). Každou noc se provádí inkrementální záloha a jednou za měsíc plná záloha. V současné době se uchovávají 4 verze plných záloh, tj. data jsou přístupná s minimálně 3 měsíční historií.

Zpět

Jak můžu obnovit ztracený soubor?

A: V případě, že chcete obnovit smazaný soubor, musíte se přihlásit na ui2 nebo prak3 pomocí ssh -X a potom se už bez hesla zalogovat na storage5

ssh storage5

a zadat příkaz

nwrecover &

Dostanete grafické GUI k obnově.

Podrobnější informace naleznete zde.

Zpět

3. Zadávání úloh do fronty

Do jaké fronty mám úlohy posílat?

A: Úplný seznam front získáte po přihlášení na ui2 nebo prak3 pomocí příkazu

qstat -q

Základní informace o rozdělení front naleznete zde. Úlohy se nesmí posílat do front označených lcg a také do front testovacích.

Zpět

Jakým způsobem se úloha do fronty zadává?

A: Úloha je v zásadě skript, který si předem připravíte a potom zadáte do fronty pomocí příkazu qsub. Příkaz vrátí Job ID.

qsub -q <jméno fronty> <seznam parametrů> <váš skript>

1234567.golias

  • Skript se spouští ve vašem domovském adresáři. Proto je třeba u všech příkazů, které nejsou v domovském adresáři, použít plnou cestu nebo příkaz cd.
  • Při spuštění úlohy se v pracovním adresáři /scratch automaticky vytvoří podadresář /pbstmp.cislojobu.golias. Současně se vytvoří proměnná $TMPDIR, která do tohoto adresáře ukazuje. Proto je třeba ve skriptu pro uložení dočasných dat použít proměnnou $TMPDIR. Podadresář se po skončení úlohy automaticky smaže.

V seznamu parametrů můžete např. specifikovat přepínačem:

  • -m o jakých událostech dostávat e-mail
  • -o kam uložit výstupní soubor stdout (standardně se stdout ukládá do adresáře, ze kterého byl spuštěn příkaz qsub)
  • -e kam uložit chybový soubor stderr (standardně se stderr ukládá do adresáře, ze kterého byl spuštěn příkaz qsub)
  • -l požadavky úlohy na
    • vlastnosti uzlu (např. typ model=, operační systém bits=, ... )
    • zdroje (např. počet uzlů select= , počet procesorů na jednom uzlu ncpus=, množství skutečného času walltime=, velikost paměti mem=, ... )
Úplný seznam vlastností a zdrojů naleznete na manuálové stránce

man pbs_resources

Podrobné informace o příkazu qsub jsou zde nebo na manuálové stránce

man qsub

Zpět

Chci dostávat e-mailem informaci o případném přerušení úlohy.

A: Nejprve si v domovském adresáři /home vytvořte soubor .forward a do něho napište seznam e-mailových adres, na které chcete zprávy posílat.

V příkazu qsub si pomocí parametru -m zvolte, o jakých událostech chcete dostávat e-mail:

  • a (abort) zpráva o přerušení úlohy
  • b (begin) zpráva o spuštění úlohy
  • e (end) zpráva o ukončení úlohy

Např. chcete-li zprávu o spuštění, ukončení i případném přerušení úlohy, zadáte

qsub -q <jméno fronty> -m abe [-l <seznam požadavků na výpočetní zdroje>] <váš skript>

Pozn.: Pokud nemáte vytvořený soubor .forward, můžete e-mailovou adresu specifikovat přímo v příkazu qsub dalším parametrem -M <e-mailová adresa>.

qsub -q <jméno fronty> -m abe -M <e-mailová adresa> [-l <seznam požadavků na výpočetní zdroje>] <váš skript>

Zpět

Jak si mám rezervovat dva výpočetní uzly a na každém dva procesory?

A: Požadavky úlohy na výpočetní uzly se zadávájí pomocí tzv. chunků. Každý chunk obsahuje seznam požadavků na jeden výpočetní uzel. Jednotlivé požadavky jsou oddělené dvojtečkou ve tvaru <resource_name=hodnota>. Kromě obsahu chunku uživatel specifikuje i jejich počet N.

-l select=[N:] chunk [+[N:] chunk ...]

Pokud N není uvedeno, dosadí se automaticky hodnota 1.

Počet požadovaných procesorů na jednom uzlu se zadává specifikací ncpus. Dva výpočetní uzly a na každém dva procesory zadáte specifikací

qsub -q <jméno fronty> -l select=2:ncpus=2 <váš skript>

Zpět

Jak si mám rezervovat jeden výpočetní uzel se třemi procesory na 100 hodin skutečného času?

A: Požadavek na množství skutečného času se zadává specifikací walltime. Tento požadavek patří mezi tzv. job-wide limits, limity, které úloha požaduje jako celek. (Na rozdíl od tzv. per-chunk limits, limitů, které úloha požaduje na jeden výpočetní uzel). Job-wide limits jsou v příkazu qsub vypsány samostatně s parametrem -l, tzn. nezařazují se do výčtu chunků -l select= ....

qsub -q <jméno fronty> -l walltime=100:00:00 -l select=1:ncpus=3 <váš skript>

Zpět

Jak mám spustit úlohu na konkretnim stroji (např. na stroji typu bl35p s 64bitovým OS)?

A: Požadavky na vlastnosti výpočetního uzlu se zadávají specifikací parametrů model a bits v rámci tzv. chunků ( -l select= ... ).

qsub -q <jméno fronty> -l select=1:model=bl35p:bits=64bit <váš skript>

Zpět

Jak mám spustit úlohu náročnou na paměť?

A: Úlohu náročnou na paměť je vhodné spustit na jednom samostatném výpočetním uzlu. Vyhrazení uzlu se zadává specifikací -l place=excl. Na daném uzlu tedy poběží jedna jediná úloha i v případě, že nejsou obsazené všechny procesory.

qsub -q <jméno fronty> -l select=1 -l place=excl <váš skript>

Zpět

Jak se zadává interaktivní úloha?

A: Interaktivní úloha je určena především pro ladění a překlady programů. Spustí se pomocí přepínače -I. Získáte prompt shellu na přiděleném výpočetním uzlu. Z terminálu můžete zadávat příkazy. Po ukončení shellu bude úloha zrušena.

qsub -I -q <jméno fronty> [-l <seznam požadavků na výpočetní zdroje>]

qsub: waiting for job 1234567.golias to start

qsub: job 1234567.golias ready

[user@goliasN ~]$ ... příkazy ...

[user@goliasN ~]$ exit

logout

qsub: job 1234567.golias completed

Zpět

Může se na výpočetním uzlu, který je ve stavu offline, spustit úloha?

A: Memůže. Na výpočetním uzlu, který je ve stavu offline, se žádná další úloha nespustí. Pouze doběhnou úlohy, které na něm už běží.

Zpět

4. Ostatní

Proč hodnota walltime neodpovídá skutečnému času?

A: Kvůli efektivnějšímu fungování fairshare (automatické přidělování výpočetních zdrojů na základě propočítaného času) byly u všech výpočetních uzlů nastaveny multiplikátory, kterými je násoben jednak cput - čas, který úloha zabrala na daném procesoru, jednak walltime - skutečný čas, po který úloha obsazovala výpočetní uzel. Multiplikátory vyjadřují poměr výkonu daného výpočetního uzlu vůči referenci, kterou je stroj typu dl140. Proto hodnoty cput a walltime uvedené pro danou úlohu neodpovídají skutečným hodnotám. Je třeba si je příslušným multiplikátorem přepočítat. Přehled multiplikátorů pro různé typy strojů je uveden zde.

Zpět

Jak si mám změnit login shell?

A: Přihlašte se na golias.farm.particle.cz a pomocí příkazu chsh si změňte login shell. Do půl hodiny změna automaticky proběhne i na strojich ui2 a prak3.

Zpět

...

- JanaUhlirova - 01 Jul 2008

Edit | Attach | Printable | Raw View | Backlinks: Web, All Webs | History: r18 < r17 < r16 < r15 < r14 | More topic actions
 
Powered by TWiki
This site is powered by the TWiki collaboration platformCopyright &Š by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback