Cílem tohoto článku je informovat především kvantitativně zaměřené sociální vědkyně a vědce o základních vlastnostech velkých dat a představit možnosti a omezení využívání těchto dat v sociálně vědním výzkumu. Text postupně zprostředkovává informace o třech základních typech velkých dat, tak jak jsou rozlišovány v současné metodologické literatuře – administrativních datech, transakčních datech a datech ze sociálních sítí – a ilustruje na příkladech, k čemu je možné tato data využít v oblasti kvantitativního sociologického výzkumu, jehož dominantní metoda – výběrové dotazníkové šetření – se podle mnohých ocitla v krizi, zejména z důvodu snižující se návratnost šetření ve většině vyspělých zemí a upadající důvěry veřejnosti v průzkumy veřejného mínění.
Autorka textu prezentuje vlastnosti a specifika velkých dat z perspektivy výzkumu využívajícího právě výběrová šetření, tedy metodu, jejímž nejdistinktivnější rysem je schopnost kvantifikace chování, sociálního jednání a postojů jednotlivců na úrovni populací. V tomto kontextu je upozorněno na odlišnosti, které velká data vzhledem k datům z výběrových šetření mají, mezi nimiž jsou různými odborníky nejčastěji uváděny nereprezentativita datových souborů za známé populace, systematické vychýlení hodnot sledovaných proměnných, omezené množství proměnných v souborech velkých dat, nejistota ohledně významu pozorovaných hodnot proměnných nebo přímý vliv sociálního okolí na chování aktérů zachycených ve velkých datech.
Pozornost je věnována i vlastnostem velkých dat, které překážejí tomu, aby se mohl tento nový druh dat hladce zapojit do sociálně vědního středního proudu. Těmito vlastnostmi jsou především vysoká náročnost získávání, zpracování a analýzy velkých dat, která vyžaduje pokročilé programátorské schopnosti, které sociální vědci většinou nemají, a také omezená dostupnost velkých dat, vyplývající se skutečnosti, že data jsou zpravidla vlastněna soukromými komerčními subjekty, z nichž některé jako je např. Facebook či Google již lze bez přehánění označit za datové oligopoly, jejichž management se o data s akademiky nemá, ve většině případů, zájem dělit. Uvedená specifika, odlišnosti a omezení jsou v tomto textu interpretována jako argument pro tvrzení, že velká data v současné době nemají potenciál stát se plnohodnotným datovým zdrojem pro sociálně vědní výzkum, a tedy ani potenciál vystřídat na pozici dominantní výzkumné metody výběrová šetření.
Článek dále upozorňuje na specifickou povahu různých typů velkých dat, vyplývající ze skutečnosti, že velká data jsou primárně generována za jinými účely, než sociální výzkum, a jsou výsledkem specifické situace dané existujícími společenskými vztahy, a jako takové je třeba je chápat v kontextu sociálního výzkumu.