Monitorovani farmy Golias
Nagios
Dostupny pro administratory na
strance
Poznamky
- Pro pridani mezi administratory potrebujete certifikat, jeho subject s zadosti pak napiste do vs-admin.
- Nagios posila info o dulezitych vypadcich primo na mail, jabber nebo smskou. Pokud se chcete pridat do jedne z techto skupin zalozte novy kontakt do /etc/nagios/contacts.cfg podle vzoru, ktery v souboru najdete a nasledne tento kontakt pridejte do prislusne skupiny v souboru /etc/nagios/contactgroups.cfg
Ganglia
ganglia
Munin
munin
Monitorovani LHC Experimentu
ATLAS
ALICE
Ruzne monitorovaci skripty
Ulohy v PBS
Vystup prikazu "qstat -Q" se generuje kazdych 10 minut skriptem
/home_farm/chudoba/scripts/qstat_mon.sh spoustenym z cron na hpv2. Stejny skript generuje i
stranku s vypisem vsech uloh v PBS zaroven s jejich propocitanym
a celkovym casem. Mozno obcas zkontrolovat log soubor /home_farm/chudoba/logs/qstat_mon.log, zda nenastavaji chyby
pri generovani stranek. Skript prenesen z hpv dne 19.6.2008.
Ulohy v PBS - grafy s historii
Pocet celkove bezicich uloh, cekajicich uloh, volnych CPU a offline CPU se kazdych 15 minut aktualizuje
na
teto strance. Skript jchmon_A.pl se
spousti na hpv2 pod uctem chudoba a vytvari tez 3 grafy s historii techto hodnot za
den,
tyden a
mesic.
Skript prenesen z hpv dne 13.7.2008.
ALICE joby
Mala prehledna
stranka s poctem bezicich a cekajich uloh ve frontach ALICE. Vhodne i pro pristup ze zarizeni s malym displejem. Skript alice_queue.pl se spusti z crontabu uzivatele chudoba na hpv2 (od 8.7.2004 do 19.6.2008 na hpv). Spusti prikaz qstat -Q, parsuje vysledek a vytvori html stranku jen s udaji o frontach ALICE.
--
JiriChudoba - 19 Jun 2008