Komplexní analýza dostupnosti stávajících datových zdrojů a jejich upotřebitelnosti

pondělí 13. srpna 2018 ·

„Česká republika (ČR) se ve sběru dat v oblasti školství vyznačuje vysokou mírou nejednotnosti a nekomplexnosti. Sběru a následné analýze dat v oblasti vzdělávání se v ČR primárně věnuje několik institucí, jejichž činnost však není koordinována takovým způsobem, aby poskytovaly datové zdroje, které by umožnily český systém vzdělávání analyzovat v jeho komplexnosti, a zejména pak v průběhu času (mnohdy tak chybí panelová data potřebná pro komplexní analýzu vývoje ve vzdělávání),“ píše se ve studii České školní inspekce. Přinášíme přehled některých základních zjištění studie.


Komplexní analýza dostupnosti stávajících datových zdrojů a jejich upotřebitelnosti je vstupním analytickým dokumentem popisujícím disponibilní data využitelná pro analýzy v oblasti vzdělávání. Smyslem tohoto dokumentu je vytvořit komplexní a strukturovaný přehled o datových zdrojích, které bude možné upotřebit zejména při zpracování dalších výstupů KA5 v rámci projektu Komplexní systém hodnocení (KSH). Primárním cílem hledání datových zdrojů je proto nalézt taková data, která by byla vhodná k propojování s daty mezinárodních šetření PISA, TIMSS, PIRLS a národních testování realizovaných přímo ČŠI. Cílem propojování dat z více zdrojů s daty, kterými již ČŠI disponuje, je zvýšení analytické vypovídací hodnoty dat z testování, která ČŠI provádí, a tím zkvalitnění obecných analytických závěrů vypovídajících o vzdělávacím systému ČR. Vedle toho přináší tato analýza přehled datových zdrojů, které mohou upotřebit další uživatelé.

Dokument přináší jak přehled relevantních datových zdrojů, tak vysvětlení významu těchto datových zdrojů z hlediska posuzování výsledků a průběhu vzdělávání v ČR. Dále se věnuje možnostem propojování externích datových zdrojů s daty běžně získávanými Českou školní inspekcí. Analýza pak přináší i jejich bližší charakteristiku a popis jejich dostupnosti. Analýza představuje jednotlivé datové zdroje podle institucí, které jimi disponují, tedy je buďto přímo pořizují, nebo spravují. Analýza dále přináší představení dat z hlediska jejich časového záběru, existence případných časových řad, představuje typy sledovaných proměnných a zabývá se relevancí těchto dat pro další analýzy.

Česká republika (ČR) se ve sběru dat v oblasti školství vyznačuje vysokou mírou nejednotnosti a nekomplexnosti. Sběru a následné analýze dat v oblasti vzdělávání se v ČR primárně věnuje několik institucí, jejichž činnost však není koordinována takovým způsobem, aby poskytovaly datové zdroje, které by umožnily český systém vzdělávání analyzovat v jeho komplexnosti, a zejména pak v průběhu času (mnohdy tak chybí panelová data potřebná pro komplexní analýzu vývoje ve vzdělávání).

Klíčovými institucemi, které disponují datovými zdroji v oblasti školství, jsou Ministerstvo školství, mládeže a tělovýchovy (MŠMT) a instituce, jejichž činnost je s tímto ministerstvem provázána – jako např. Centrum pro zjišťování výsledků vzdělávání (CERMAT) a Česká školní inspekce (ČŠI). V oblastech českého školství a českého systému vzdělávání je to od roku 2005 právě ČŠI, která má jako jeden z cílů sběr dat vztahujících se k nejrůznějším dílčím tématům. Získaná data se vztahují k mateřským, základním, středním a vyšším odborným školám a dále také k zařízením zapsaným do školského rejstříku, jako jsou např. školní jídelny či domovy mládeže. Mimo to je ČŠI současně také institucí, která v rámci ČR zajišťuje průběh několika mezinárodních testování a s tím související sběr dat (např. testování PISA, TIMSS, PIRLS, ICILS či TALIS)1. Databáze ČŠI je proto zcela unikátním zdrojem, který poskytuje komplexní datové soubory, na jejichž základě je možné vytvářet sekundární analýzy dílčích oblastí vzdělávání, a to na několika úrovních agregace. V neposlední řadě se věnují sběru dat v oblasti vzdělávání a školství některé neziskové organizace, jako např. Člověk v tísni v rámci vzdělávacího programu Jeden svět na školách.

Mimo výše uvedené hlavní instituce zabývající se sběrem dat v oblasti vzdělávání a školství byly do analýzy zahrnuty téměř všechny organizace a instituty, které se v ČR zaměřují především na další vzdělávání učitelů, metodickou část výuky apod. (např. EDUin, ARPOK, IDV, NÚV či NIDV). Tyto organizace a instituty se ovšem nesoustředí primárně na sběr relevantních kvantitativních dat, která by byla využitelná pro sekundární nebo dílčí analýzy ve zvolených tematických oblastech. Mimo výše uvedené instituce existuje na území ČR několik dalších institucí, jež se zaměřují na sběr sociálních dat z různých oblastí, přičemž v nepravidelných intervalech sbírají rovněž data týkající se dílčích témat v oblasti českého školství. Jedná se zejména o Český statistický úřad (ČSÚ) a Centrum pro výzkum veřejného mínění (CVVM). Jako výhodu lze u těchto institucí hodnotit skutečnost, že jimi poskytovaná data jsou veřejně dostupná. Ovšem s ohledem na tematické zacílení těchto dat, nepravidelnost jejich sběru a proměnlivost zkoumaných témat mohou být tyto datové zdroje použity obvykle pouze jako doplňkové. Na jejich základě je totiž možné vystavět pouze omezené sekundární analýzy vybraných oblastí českého školství. V mezinárodním kontextu (a to jak na makroúrovni, tak na mikroúrovni) se pak jedná zejména o Eurostat (Statistický úřad Evropské unie), jehož datové zdroje z jednotlivých zemí jsou zpracovávány do jednotné podoby a umožňují tedy mezinárodní srovnání.

Následující text obsahuje podrobnou analýzu dostupnosti stávajících datových zdrojů v oblasti českého školství a vzdělávání a možnosti jejich upotřebitelnosti jak v rámci projektu Komplexní systém hodnocení, tak pro obecné analytické potřeby v oblasti vzdělávání. V příloze je pak uveden návod pro sběr dat a seznam upotřebitelných indikátorů (proměnných), jejich typ a úroveň agregace.

Shrnutí a doporučení

Pro potřeby dílčích i komplexních analýz je možné vytvořit jednotnou databázi všech veřejně dostupných datových souborů, které tato analýza identifikovala. Ty budou roztříděny dle zdroje dat, tematického zaměření, úrovně měření (žáci, školy, kraje, stát). Jednalo by se o datový archiv, který by byl veřejně dostupný (např. na stránkách ČŠI) v českém i anglickém jazyce. Vytvoření online datového archivu si vyžádá pouze činnost stávajících zaměstnanců.

V dnešní éře pokročilých analýz velkého objemu dat (big data) by komplexnost, porovnatelnost a systematičnost zvýšilo propojování všech dat do jednoho velkého datového souboru. Základním identifikátorem tohoto souboru by byl kód školy (např. REDIZO). Kód školy umožňuje snadnou párovatelnost, resp. propojitelnost různých datových sad. Druhým identifikátorem by byl kód obce, pro členěná statutární města a hlavní město Prahu pak kód místní části. Krokem k systematizaci by bylo pravidelné udržování této databáze, což by umožnilo ČŠI provádět sofistikované analýzy na velkém množství dat (například v programu R). Pro kvantitativní analýzu dat z této databáze pak nemusí být splněny zcela přísné akademické standardy, jako je reprezentativnost vzorku. Způsobem vytěžení všech dat by byl tzv. data mining. Jedná se o analytický způsob získávání netriviálních skrytých a potencionálně užitečných informací z velkého množství dat.


Studii ke stažení naleznete zde

1 komentářů:

tyrjir řekl(a)...
13. srpna 2018 v 15:37  

Systémová korupce jak vyšitá říká NKÚ: Řízení státu je pod silným vlivem ekonomických skupin. Velká Korupce se neřeší a je mnohdy posvěcována i ve sněmovné, vládě, u soudů, v úřadech a v tzv. odborných skupinách. Biti jsou, kdo nekradou.

Viz

https://www.hlidacstatu.cz/texty/nku-pro-prezidenta-zemana-vazne-problemy-v-hospodareni-statu/

Ten rozbor NKÚ stojí za přečtení. Těším se na další "oprávněný nesouhlas" MŠMT a ČŠI s výsledky šetření NKÚ u nich. Vždyť oni se přeci v tom svém úřadě se svými odbornými útvary a ad hoc skupinami tolik snaží.

J.Týř


Články dle dataUčitelské listy

Nabídka práce

Česká škola - portál pro ZŠ a SŠ

Česká škola poskytuje svým čtenářům diskusní prostor k vyjádření názorů na školskou problematiku. Tyto příspěvky se nemusí shodovat se stanoviskem redakce České školy a jsou uveřejňovány jako podnět k dalším diskusím.

Obsah článků nemusí vyjadřovat stanovisko redakce nebo vydavatele Albatros Media, a.s.


Všechna práva vyhrazena.

Tento server dodržuje právní předpisy
o ochraně osobních údajů.

ISSN 1213-6018
Licence Creative Commons

Obsah podléhá licenci Creative Commons Uveďte autora-Neužívejte dílo komerčně-Nezasahujte do díla 3.0 Česká republika, pokud není uvedeno jinak nebo nejde-li o tiskové zprávy.WebArchiv - archiv českého webuTyto webové stránky používají k poskytování služeb, personalizaci reklam a analýze návštěvnosti soubory cookie. Informace o tom, jak tyto webové stránky používáte, jsou sdíleny se společností Google. Používáním těchto webových stránek souhlasíte s použitím souborů cookie.