Projekt digitalizace Díla Jana Amose Komenského byl zahájen
za finanční pomoci Grantové agentury ČR v roce 2002. Jeho podstatou
je zpřístupnit v digitální podobě Komenského práce,
vydávané od roku 1969 v ediční řadě Dílo
Jana Amose Komenského – J. A. Comenii Opera omnia. Tyto texty, kvalitně
připravené řadou prvotřídních odborníků v jazycích
originálu, budou tím pádem připravené jak pro studium,
tak i pro další ediční či jinou publikační práci.
Podstatnou částí projektu není samozřejmě jen reprodukce
textů, ale i možnost pokročilých operací, umožněných
digitalizací. Prosté texty jsou upraveny do podoby jazyka XML
a tak připraveny pro vyhledávací operace. Pomocí nich bude
možné celé dílo Komenského třídit na základě
jazykových, časových, místních či jiných
kritérii vztahujících se k době vzniku textu, stejně jako
na základě kritérií vyplývajících
z edice: podle zařazení textů v jednotlivých svazcích,
podle jmen editorů apod.
Postup prací
Každý svazek byl naskenován pomocí skeneru A3 (Fujitsu
M3096GX)a strojově
rozpoznán pomocí programu OCR FineReader. Tento surový
a mnoha chybami protkaný text byl zadán externím redaktorům,
rekrutujícím se vesměs z řad studentů Pedagogické fakulty
Univerzity Karlovy v Praze. Ti měli za úkol provést znakovou korekturu
celého textu a upravit původní rozložení stránky
do kontinuálního textu za pomoci strukturních značek (paginace
originálu a paginace edice, marginálie). Pokročilým stadiem
úprav bylo doplnění strukturních značek vyznačujících
příznakové jazyky. U každého textu byl stanoven bezpříznakový
jazyk, tedy ten, ve kterém bylo dílo napsáno, ostatní
jazyky objevující se v textu jsou chápány jako příznakové
– takové jsou latinské, německé, řecké či jiné
vsuvky v českém textu, naopak české či jiné v latinském
atd. z tohoto principu byly vyčleněny názvy děl. Tato volba umožní
vyhledávání a prohledávání jednotlivých
jazykových pasáží i různé pokročilé jazykovědné
práce.
Po redakčním zpracování probíhala druhá
korektura, tentokrát odstavcová, během níž byl text zrevidován
po stránce formální, vyřešeny rozmanité problémy
týkající se specifik různých druhů Komenského
přístupu (logické stromy, vsazené obrázky, tabulky,
časomíra atd.), doplněna hlavička, jednoznačně definující
dokument (zkrácený název práce; bezpříznakový
jazyk; datum vzniku; typ dokumentu jako rukopis, opis, tisk; příslušný
svazek DJAK, pořadí dokumentu ve svazku DJAK, rozsah stran v DJAK, datum
vydání, jména editorů). Poslední prací je
převádění textového dokumentu do surového formátu
XML pomocí volně šiřitelného programu OOWriter sady Open Office.
Text je nakonec posílán spolupracovníkovi Mgr. Pavlu
Rychlému, PhD. na Fakultu informatiky Masarykovy univerzity v Brně, jehož
úkolem je vytvořit výslednou textovou databázi: naprogramovat
postup převádení surového XML do pokročile strukturovaného
formátu XML a vytvořit uživatelské
prostředí. Nároky na tyto práce jsou značné, protože
jde o zpracování kritické edice a jedním z požadavků
je zachování vazeb mezi textem a aparátem,a to jak jazykově
kritickým, tak i věcným. Zadání požaduje možnost práce jak
s textem a aparátem, tak i jen s textem i jen s aparátem.
v současné době je většina textů (podrobnosti viz připojený
"přehled zpracovaných textů") ve stavu zkorigovaného
textu, vybaveného strukturními značkami a hlavičkami. Značné
zpoždění bohužel způsobuje spolupráce s externími pracovníky
brněnské univerzity, kvůli níž převod do finálního tvaru v jazyce XML a vybudování textové databáze
zaostává za původním časovým plánem dokonce o několik pololetí.
Výstup projektu bude k dispozici ve zkušebním provozu na lokálních
počítačích na pracovišti v budově ústavu v Jilské
ulici 1 v Praze 1, po ověření funkčnosti bude práce uveřejněna
v síti internet.
Přehled zpracovaných textů
První sloupec "svazek" značí číslo rozpoznávaného
svazku, "název" jméno pasáže, "rozsah"
rozsah stran v edici DJAK, "redakce" značí práci provedenou
externími redaktory, "korektura" značí finální
text po všech úpravách.
svazek
název
rozsah
redakce
korektura
1
Předmluva
7–11
ano
ano
1
Epistula ad
Montanum
12–56
ano
ano
1
Problemata
miscellanea
57–69
ano
ano
1
Sylloge
quaestionum controversarum
71–94
ano
ano
1
Theatrum
universitatis rerum
95–181
ano
ano
1
Amphiteatrum
universitatis rerum
183–200
ano
ano
1
O vycházení a
zapadání ... hvězd
201–218
ano
ano
1
Mapa Moravy
219–266
ano
ano
1
Moudrost
starých Čechů
267–389
ano
ano
1
zkratky
ano
ano
1
rejstřík
ano
ano
2
Retuňk proti
Antikristu
7–288
ano
ano
2
Haggaeus
redivivus
289–398
ano
ano
2
zkratky
ano
ne
2
rejstřík
ano
ne
3
Předmluva
7–15
ano
ne
3
Truchlivý
I–IV
17–160
ano
ne
3
Listové do
nebe
161–184
ano
ano
3
Přemyšlování
o dokonalosti křesťanské
185–233
ano
ano
3
Nedobytedlný
hrad
235–263
ano
ano
3
Labyrint
světa
265–412
ano
ano
3
Pres Boží
413–426
ano
ano
3
O sirobě
427–472
ano
ano
3
Centrum
securitatis a Renuntiatio mundi
473–564
ano
ano
3
Bazuine des
genaden jaar
565–589
ano
ano
3
Kšaft
umírající matky
591–614
ano
ano
3
zkratky
ano
ne
3
rejstřík
ano
ne
4
Předmluva
7
ano
ne
4
Naučení o
kazatelství
9–120
ano
ano
4
Veršované
skladby
121–154
ano
ano
4
O poezi české
155–170
ano
ano
4
Catonis
disticha
171–212
ano
ano
4
Žalmy
213–290
ano
ano
4
Nové písně
některé
291–330
ano
ano
4
Žehnání kněze
Jana Cyrilla
331–342
ano
ano
4
Písnička ku
pohřbu Pavla Fabricia
343–351
ano
ano
4
Veršované
modlitby z přídavků k Praxis pietatis
353–370
ano
ano
4
Písně a
kratší básnické projevy
371–381
ano
ano
4
De metris
Bohemicis ..., Parafráze IV. eklogy
383–393
ano
ano
4
Carmina per
occasionem scripta
395–423
ano
ano
4
zkratky
ano
ano
4
rejstřík
ano
ano
9/I
Pojetí dějin
v díle J. A. Komenského
7–22
ano
ano
9/I
Historia
profana
23–47
ano
ano
9/1
Historia
persecutionum
dtto
ano
ano
9/I
Historia o
těžkých protivenstvích
49–442
ano
ano
9/I
zkratky
ano
ne
9/I
rejstřík
ano
ne
11
Rané
didaktické spisy J. A. Komenského
7–12
ano
ano
11
Paradisus
ecclesiae, Ráj církve
13–32
ano
ano
11
Didaktika
33–221
ano
ne
11
Informatorium
školy mateřské
223–275
ano
ano
11
Informatorium
maternum
277–345
ano
ano
11
Navržení
krátké o obnovení škol
347–358
ano
ano
11
Dvéře jazyků
odevřené
359–435
ano
ano
11
Diogenes
cynicus redivivus
437–500
ano
ne
11
Abrahamus
patriarcha
501–539
ano
ne
11
zkratky
ano
ne
11
rejstřík
ano
ne
12
Geometria
9–39
ano
ano
12
Cosmographiae
compendium
41–68
ano
ano
12
Physicae
synopsis, ad physicam addenda
69–264
ano
ano
12
Disquisitiones
de caloris et frigoris natura
265–292
ano
ano
12
Cartesius a
mechanicus everus
293–308
ano
ano
12
De motu
perpetuo scriptorum reliquiae
309–386
ano
ne
12
zkratky
ne
ne
12
rejstřík
ne
ne
13
Sermo
secretus Nathanis ad Davidem
9–34
ano
ano
13
Gentis
felicitas
35–66
ano
ano
13
Panegyricus
Carolo Gustavus
67–94
ano
ano
13
Letzte posaun
über Deutschland
95–154
ano
ano
13
Syllogismus
orbis terrarum practicus
155–174
ano
ano
13
Angelus pacis
175–211
ano
ano
13
Faber
fortunae
213–265
ano
ano
13
Regulae vitae
267–284
ano
ano
13
Fortii
Erasmique libellis praemissa
285–292
ano
ano
13
Appendix
Vestibuli
293–311
ano
ano
13
zkratky
ano
ano
13
rejstřík
ano
ano
14
Janua rerum
sive Totius pansophiae seminarium
9–48
ano
ano
14
Pansophiae
Christianae liber III
49–107
ano
ano
14
Ad amicos
Lesnae in Polonia agentes
109–116
ano
ano
14
Consultationis
brevissima delineatio
117–126
ano
ano
14
Elaborandorum
operum catalogus
127–136
ano
ano
14
Studii
pansophici in Anglia fautoribus
137–150
ano
ano
14
Janua rerum
reserata (zlomek)
151–168
ano
ano
14
Pansophiae
diatyposis, Templi pansophici delineatio scenographica, Scenographiae
pansophicae pars II