Projekt

Vývoj centralizovaného rozhraní pro vytěžování velkých dat z webových archivů

Trvání projektu: 
2018 - 2022

V posledních 25 letech internet a webové stránky výrazně změnili lidskou komunikaci. V prostředí internetu průběžně narůstá objem publikovaných dokumentů, které se však postupně mění nebo zcela mizí. Pokud by nebyly průběžně archivovány, byla by tato významná část mezilidské komunikace navždy ztracena. Úlohou webových archivů je archivovat v co nejúplnější podobě webové stránky a zachovávat tak hodnotný zdroj informací, které mohou využívat i sociální vědci.

Mezi hlavní cíle projektu patří aplikovaný výzkum a experimentální vývoj systému pro identifikaci, správu a zpracování širokého spektra dat českého webového archivu (webarchiv.cz). Hlavním účelem je umožnit široké odborné veřejnosti využívat potenciál dlouhodobě shromažďovaných dat. Ta jsou dosud z velké části nezpracovaná, a tedy vědcům nepřístupná. Projekt propojuje oblast vytěžování velkých dat, tzv. big data, z českého webového archivu a oblast výzkumu sociálněvědních oborů.

Na projektu se v rámci Sociologického ústavu AV ČR, v. v. i., podílí tato oddělení: Centrum pro výzkum veřejného mínění, Český sociálněvědní datový archiv, Lokální a regionální studia, Hodnotové orientace ve společnosti

Hlavní řešitel: 
Západočeská univerzita v Plzni
Národní knihovna ČR – Webarchiv
Témata: 
metodologie výzkumu
sociologická data
Zadavatel: 
ministerský projekt

Publikace vydané v rámci projektu (celkem 1, zobrazeno 1 - 1)

Matouš Pilnáček, Paulína Tabery, Martin Vávra

Internet se v posledních třech desetiletích stal integrální součástí soudobých společností a jeho obsah postupně ohromně narůstá a velmi dynamicky se proměňuje. I tak však společenské vědy a společenští vědci nevěnují přílišnou pozornost tomu, jaké svědectví může web nabídnout ohledně společenských změn. Tento článek se věnuje úvodu do problematiky webových archivů, které mohou sloužit jako zdroj dat částečně vypovídající o dynamické proměně současné společnosti a komunikace.

Téma:
metodologie výzkumu
Oddělení:
Centrum pro výzkum veřejného mínění, Český sociálněvědní datový archiv
Typ publikace:
recenzovaný článek