Oddělení statistického modelování

Název oddělení

Oddělení statistického modelování

Stručná charakteristika oboru výzkumu

Statistika v různých formách, jako je např. matematická statistika, biostatistika, aplikovaná statistika, ekonometrie, psychometrie nebo dokonce bioinformatika a tzv. ‚datová věda‘, představuje jednu z informačních věd, které využívají pozorovaných dat k tomu, aby odvodily závěry o realitě. Toho je konkrétně dosaženo na základě konceptu návrhu experimentů, vztahujících se k různým oblastem výzkumu, např. zemědělství (např. experimenty R. A. Fischera), biomedicínským vědám (poskytující ‚big data‘ z genomických studií), lékařství a farmakologii (např. analýza dat z klinických studií), inženýrství, ekonomice (ekonometrii), společenským vědám (včetně psychologie a pedagogiky) a mnoha dalším oblastem vědeckého výzkumu. Observační studie, ať už průřezové nebo longitudinální, nabízejí jiný zdroj informací, které poskytují data ve formátu časových řad. Observační studie mohou také zahrnovat ‚velká data‘ (např. data ze satelitního sledování celosvětového počasí). Statistická věda tedy pokrývá oblast základního i aplikovaného interdisciplinárního výzkumu.

Klíčové výzkumné trendy v dané oblasti

Členové Oddělení statistického modelování s věnují různým aspektům vědeckého výzkumu ve statistice. Jedná se zejména o následující směry: lineární a zobecněné lineární modely pro nezávislá data, smíšené varianty obou tříd modelů pro korelovaná data (např. průřezové a epidemiologické studie), zobecněné aditivní modely (GAM) umožňující flexibilní modelování na základě vysvětlujících proměnných, metody redukce dimenzionality (‚big data‘), metody analýzy cenzorovaných dat (longitudinální, kohortové studie), imputace chybějících dat, hierarchické regresní modely, robustní metody navržené tak, aby odvodily správné závěry i za přítomnosti odlehlých hodnot, problémy s přechodem v časových řadách apod. V posledních letech výrazně vzrostl objem a komplexita dat, která statistická věda zpracovává.

Vize oddělení

Matematická statistika je jedním ze základních prvků, který se odráží v managementu dat, zpracování a extrakci užitečných informací z dat za simultánní kontroly hladiny spolehlivosti resp. kredibility našich závěrů, které jsou často založeny na velkých objemech složitých a zašumělých vstupů. Důraz na ‚modelování‘ v názvu oddělení naznačuje náš zájem o vývoj pokročilých metod a algoritmů, které využívají návrhové fáze studií a experimentů a vedou k optimalizaci podpory rozhodování ve výše uvedených vědeckých disciplínách. Oddělení klade klíčový důraz na podporu statistických přístupů k řešení různých problémů základního a interdisciplinárního výzkumu, kde inspirace pro rozvoj pokročilé statistické metodiky a algoritmů přichází především z oblasti souvisejícího výzkumu. Vědecké hypotézy typicky pocházející ze souvisejících vědních oborů jsou přeformulovány jako statistické hypotézy a nové testovací postupy jsou navrhovány tak, aby odpovídaly na tyto vědecké otázky.

Odůvodnění vize

Oddělení přispěje k dalšímu rozvoji statistické teorie a metodiky, především ve vztahu k výše uvedeným vědeckým oborům a hlavním výzkumným tématům. Interdisciplinární spolupráce s kolegy ze společenských věd bude mít za následek vývoj nových metod validace znalostí a psychologických testů, analýzu citlivosti položek a testů ve vztahu k různým cílovým skupinám, adaptivní testování a modelování pomocí smíšené regrese. Budou vyvinuty nové přístupy pro testování strukturálních změn v časových řadách a panelových datech. Členové oddělení budou pokračovat ve spolupráci v oblasti biomedicínského výzkumu zahrnující např. analýzu vrozených vad, výzkum metod a algoritmů pro analýzu kategoriálních dat (exaktní resp. intervalový odhad), vývoj pokročilých statistických metod pro analýzu trendů úmrtnosti a jejich krátkodobé a dlouhodobé predikce. Metody budou také vyvíjeny a vylepšeny tak, aby využívaly velké množství zašumělých dat, často pocházejících z heterogenních zdrojů s odlišnými původními předpoklady. Zvláštní pozornost bude věnována environmentálním datům, kdy statistické modelování může sloužit jako společný rámec pro práci s obrovským množstvím dat ze satelitů, klimatických a meteorologických modelů a různých pozorovacích sítí. V centru našeho zájmu budou dále dynamické nebo prostorové statistické modely, a to jak neparametrické tak také semiparametrické. Pro podobná data budou formulovánu závěry z dynamických a prostorových modelů na základě přístupů klasické i Bayesovské statistiky, zahrnující identifikaci modelů a odhad parametrů s aplikacemi např. v ekologii, meteorologii a antropologii, lékařství a technických oborech. Dynamické a prostorové modelování bude sloužit např. k odvození závěrů při modelování spotřeby energie. Činnost oddělení bude dále zahrnovat využití zobecněných aditivních modelů a stavově-prostorové modely pro vibrodiagnostiku, jako součást programu České akademie věd formulovaného v dokumentu ‚Strategie 21’.

Vybrané publikace

Aplikace

Získané poznatky mohou nalézt uplatnění při analýze komplexních dat v různých oblastech:

  • v klinické medicíně
  • v biomedicínském výzkumu
  • v molekulární genetice
  • v epidemiologii
  • v analýze obrazu
  • v psychometrii
  • v environmentálním výzkumu

Projekty

Členové oddělení


Vedoucí oddělení: doc. Mgr. Zdeněk Valenta, Ph.D.

Sekretářka: Lenka Semeráková