Možnosti a meze gramatiky češtiny ve světle Českého národního korpusu
Reg. číslo 405/03/0377. Řešitel: PhDr. František Štícha, CSc. (Ústav pro jazyk český AV ČR, v. v. i.) Spoluřešitelé: doc. RNDr. Vladimír Petkevič, CSc. (Filozofická fakulta Univerzity Karlovy v Praze) prof. PhDr. Petr Karlík, CSc. (Filozofická fakulta Masarykovy univerzity v Brnž) Doba řešení: 2003-2005
Anotace:
Záměrem projektu je vytyčit první kontury principiálně nového gramatického popisu češtiny, založeného na gramatické analýze velkých a žánrově reprezentativních počítačových korpusů textů. Projekt je koncipován primárně jako strukturovaný týmový výzkum typických monopolních i konkurenčních, včetně periferních gramatických forem a struktur soudobé češtiny vzhledem k tomu, jak jsou či nejsou obsaženy v Českém národním korpusu, a to v jeho centrální a největší složce, nazvané SYN 2000 (dále ČNK), obsahující v současnosti 100 milionů slovních forem, a v Pražském závislostním korpusu.
Konkrétně patří k záměru projektu na bázi ČNK: (a) evidovat problémové jevy velmi či značně frekventované, které navzdory tomu nebyly dosud v gramatikách představeny buď vůbec, anebo jen neúplně či nahodile; (b) evidovat i jevy málo frekventované, mezní a řídké nebo sporné, jejichž popis dosud buď zcela schází, anebo je neúplný, nahodilý či mylný vzhledem k tomu, že - ve srovnání s nynžjšími možnostmi - vycházel z velmi omezeného jazykového materiálu; (c) podat statistická data o evidovaných jevech a vyvodit z nich údaje o jejich typičnosti nebo okazionalitě a o jejich stylové hodnotě;
(d) na základě této evidence vytvořit materiálovou a metodologicko-teoretickou bázi pro budoucí velkou gramatiku češtiny.
|