Project

Vývoj centralizovaného rozhraní pro vytěžování velkých dat z webových archivů

Project duration: 
2018 - 2022

V posledních 25 letech internet a webové stránky výrazně změnili lidskou komunikaci. V prostředí internetu průběžně narůstá objem publikovaných dokumentů, které se však postupně mění nebo zcela mizí. Pokud by nebyly průběžně archivovány, byla by tato významná část mezilidské komunikace navždy ztracena. Úlohou webových archivů je archivovat v co nejúplnější podobě webové stránky a zachovávat tak hodnotný zdroj informací, které mohou využívat i sociální vědci.

Mezi hlavní cíle projektu patří aplikovaný výzkum a experimentální vývoj systému pro identifikaci, správu a zpracování širokého spektra dat českého webového archivu (webarchiv.cz). Hlavním účelem je umožnit široké odborné veřejnosti využívat potenciál dlouhodobě shromažďovaných dat. Ta jsou dosud z velké části nezpracovaná, a tedy vědcům nepřístupná. Projekt propojuje oblast vytěžování velkých dat, tzv. big data, z českého webového archivu a oblast výzkumu sociálněvědních oborů.

Na projektu se v rámci Sociologického ústavu AV ČR, v. v. i., podílí tato oddělení: Centrum pro výzkum veřejného mínění, Český sociálněvědní datový archiv, Lokální a regionální studia, Hodnotové orientace ve společnosti

Principal investigator: 
Západočeská univerzita v Plzni
Národní knihovna ČR – Webarchiv
Topics: 
methodology
sociological data
Grant agency: 
Government ministry project

Project publications (total 1, displaying 1 - 1)

Matouš Pilnáček, Paulína Tabery, Martin Vávra

Internet se v posledních třech desetiletích stal integrální součástí soudobých společností a jeho obsah postupně ohromně narůstá a velmi dynamicky se proměňuje. I tak však společenské vědy a společenští vědci nevěnují přílišnou pozornost tomu, jaké svědectví může web nabídnout ohledně společenských změn. Tento článek se věnuje úvodu do problematiky webových archivů, které mohou sloužit jako zdroj dat částečně vypovídající o dynamické proměně současné společnosti a komunikace.

Topic:
methodology
Department:
Public Opinion Research Centre, Czech Social Science Data Archive
Type of publication:
Peer-reviewed journal article