Výstup z lednového Kulatého stolu SKAV k problematice plošného testování

pátek 27. ledna 2012 ·


Cílem prosincového kulatého stolu bylo se prostřednictvím odpovědí na následující otázky dozvědět: K čemu mohou či nemohou být výsledky plošných testů užitečné?

  • Jaké jsou zkušenosti z pilotního testování?
  • Jak budou testy ověřovat dosažení standardu?
  • Jakým způsobem se bude měřit přidaná hodnota školy?
  • Jak budeme zjišťovat klima na školách?
  • Přinese testování učitelům využitelné informace?
  • Jak budeme ověřovat netestovatelné části standardů vzdělávání?
  • Kdo poskytne školám potřebné technické vybavení pro zajištění testování?
  • Jak budou zajištěny srovnatelné podmínky pro testované žáky, pokud jich část bude používat počítač a část tištěnou formu testů?
Pozvání na tento kulatý stůl přijali tito panelisté:

  • RNDr. Jana Straková, Ph.D., výzkumná pracovnice, ISEA
  • Mgr. Jiří Dvořák, Ph.D., výzkumný pracovník, Scio, s.r.o.
  • Mgr. Maja Bihelerová, ředitelka ZŠ Bílá 1, Praha 6
  • Ing. Václav Nádvorník, zástupce ředitele, ZŠ Londýnská
Setkání moderoval Tomáš Feřtek, EDUin, o.p.s.


Na úvod T. Feřtek přečetl dopis od ústřední školní inspektorky O. Hofmannové adresovaný organizátorům kulatého stolu, kde je uvedeno, že ČŠI ruší svou předem avizovanou účast na kulatém stole, zároveň však uvítá jakékoliv podněty. T. Feřtek na základě toho navrhl, že na závěr kulatého stolu budou moci účastníci položit na kameru dotaz adresovaný ČŠI. Video záznam s těmito dotazy bude předán ústřední školní inspektorce.

Jako první z prezentujících dostala následně slovo J. Straková, která na začátek upřesnila, že se nebude vyjadřovat k tomu, jak pilotáž proběhla, jelikož se jí nepodařilo přes vynaloženou snahu získat dostatek relevantních informací. Proto si položila otázku, co má odborná komunita dělat v situaci, když plošnému testování neunikneme.

Na základě zahraničních zkušeností je na prvním místě potřeba zabránit tomu, aby výsledky plošných testů hrály důležitou roli. Dále je potřeba, aby ve vzdělávacím systému došlo ke zlepšení, protože toho plošné testy podle zahraničních analýz nedosáhnou.

V ČR nemáme s přípravou kvalitních a profesionálních testů příliš velké zkušenosti, je tedy pravděpodobné, že testy budou obsahovat nedostatky. Existuje tedy nebezpečí, že jak osudy žáků budou ovlivňovány výsledky testů, tak bude docházet k poškozování škol a učitelů, pokud bude o jejich práci na základě výsledků testů rozhodováno.

Když budou mít testy přílišnou důležitost, je zřejmé, že se školy budou zaměřovat jen na určité části kurikula a školy budou mít tendenci zbavovat se slabých žáků, což povede k ještě větším nerovnostem v našem vzdělávacím systému.

Co je tedy potřeba, aby se stalo? Je důležité, aby vznikly standardy, které se nebudou zaměřovat jen na to, co se bude testovat, ale budou zahrnovat všechny aspekty vědomostí a dovedností, které by si měly děti ze základní školy odnést. Mezinárodních komunit, které se snaží definovat, jaké dovednosti jsou v dnešní době potřeba na trhu práce a v občanském životě, je celá řada. Nadnárodní firmy působící v oblasti informačních technologií definovaly požadované dovednosti v rámci projektu Assessing and teaching competencies for 21st Century: dovednosti v oblasti učení a inovací, dovednosti v oblasti informačních technologií, dovednosti sociální a personální. Dovednostem v oblasti sociální a personální je věnována čím dál tím větší pozornost, tj. aby člověk byl schopen si stanovovat vlastní cíle, spolupracovat, vyřešit konflikt apod. (podrobněji viz prezentace). Potřebujeme, aby standardy zahrnovaly i tyto dovednosti a aby také byly tyto dovednosti hodnoceny.

Dále je potřeba, aby byl nastaven systém výběrových šetření, které budou hodnotit kurikulum v celé jeho šíři. Při výběrových šetřeních můžeme dávat různým žákům různé testy, budeme moci do testování zahrnout daleko širší oblasti. Zároveň nám výběrová šetření umožní, abychom na malých výběrových souborech mohli testovat i takové dovednosti, jejichž posouzení je z principu subjektivní, např. dovednost spolupracovat. Vzhledem k tomu, že nebudeme ve vztahu k jedincům vyvozovat žádné závěry, můžeme například vyhodnotit, jak umějí české děti spolupracovat, je to informace pro nás, jak se v jednotlivých dovednostech zlepšují. Je to důležité proto, že to, co se hodnotí, tomu věnuje veřejnost pozornost. Vysíláme tak vzkaz rodičům, učitelům, žákům, že všechny aspekty kurikula jsou důležité a že není možné se zaměřit jen na některé části kurikula, že stát se zabývá tím, aby se dařilo dosahovat pokroku i v těchto dalších oblastech.

Z mezinárodních šetření vyplývá, že na základě plošných testů k žádnému zlepšení výsledků učení nedošlo, proto se potřebujeme zaměřit na podporu. Hodnocení nám slouží k tomu, aby nám pomohlo získávat pravidelnou zpětnou vazbu k našemu učebnímu pokroku, aby nám pomohlo se zlepšovat.
Je potřeba dostatečně podrobně definovat vzdělávací cíle a zajistit, aby jim učitelé přesně rozuměli, aby rozuměli, jak vypadá, když se daří žákům dosahovat určitých cílů. K tomu je potřeba, aby učitelé měli k dispozici hodnotící úlohy, aby se s nimi naučili pracovat. S tím souvisí i to, že by ředitelé měli pravidelně hodnotit své učitele, poskytovat jim zpětnou vazbu, protože učitelům to umožní uplatňovat ji vůči vlastním žákům a stane se to přirozenou součástí jejich práce.

J. Straková uzavřela své vystoupení prohlášením, že testy nám v naší práci nepomohou, tak je potřeba jim věnovat jen takovou váhu, kterou si zaslouží.

Více informací v prezentaci.

TF: Říkala jste, že by měly být vypracovány standardy. To, co už vzniklo, nepovažujete za vyhovující standardy?
JS: Mělo by vzniknout něco, co si bude klást na začátku otázku, čím by měli být vybaveni žáci na konci prvního, resp. druhého stupně ZŠ. U existujících standardů je zřejmé, že jsou vypracovány jako podklad pro testování. Stejný problém byl i u maturitní zkoušky, kdy nebylo předem stanoveno, co si přejeme, čím by měl být vybaven absolvent SŠ, ale jen co lze testovat. Kdyby si tvůrci položili na začátku otázku, čím by měl být absolventi vybaveni, vypadaly by standardy jinak.

TF: V prezentaci je uvedeno, že je potřeba vyvinout diagnostické nástroje pro žáky s nízkou úrovní dovedností, můžete to upřesnit, co to znamená?
JS: To je převzato z materiálu OECD k hodnocení ve vzdělávacím systému. Některé vzdělávací systémy poskytují učitelům diagnostické nástroje, které jim umožní poměrně záhy rozpoznat, že žáci mají nějaké nedostatky. Například tyto nástroje používají učitelé v Maďarsku, jak mají s těmito dětmi pracovat, aby byly překonány nedostatky ve čtenářské gramotnosti. Důležité je odhalit nedostatky co nejdříve a pak pracovat na jejich odstranění.

TF: Nemůže tomuto rozpoznání sloužit plošné testování?

JS: Nemůže, protože se konají na výstupu a nikoli v době, kdy je to potřeba např. v 1., 2. třídě, kdy potřebujeme nedostatky odhalit a s tím nástrojem pracovat. Testy mohou poskytnout jen velmi povrchní vhled. Na to, aby mohli učitelé diagnostikovat, je potřeba daleko komplexnější nástroje, než jsou plošné testy.

TF: Jako takový nástroj si mohu představit čtenářskou úlohu s velmi podrobným vyhodnocením s návodem, jak konkrétní nedostatky odstranit. Máte zkušenost ze zahraničí, kde se tyto nástroje používají dlouhodobě a jaké to má výsledky?
JS: Na Novém Zélandu poskytují učitelům podrobné popisy cílů. Dbají na to, aby učitelé rozuměli těmto cílům. Poskytují učitelům ukázky žákovských prací a ukazují, proč daná práce byla hodnocena daným způsobem, tak, že vyznačí části žákovských prací, na jejímž základě byly takto hodnoceny. Na základě takových ukázek mohou učitelé pochopit, jak se nenaplnění cílů může v žákovských výkonech projevovat.

TF: Říkáte, že vedle plošného testování je potřeba provádět výběrová šetření, podle dostupných informací ČŠI s výběrovými šetřeními počítá. Je to pro vás dostatečná útěcha.
JS: Pokud plošné testy musí být, ať jsou, ale ať nejsou moc důležité. Výběrová šetření jsou důležitá v každém případě. O výkonu našeho vzdělávacího systému máme totiž velmi málo informací, pouze na základě mezinárodních šetření, ale tam řada oblastí není definována. Nemáme žádnou informaci například o tom, co naši žáci umějí v dějepisu, nakolik projevují kreativitu ve výtvarné výchově apod. Pro zpětnou vazbu pro vzdělávací systém proto, aby vzdělávací politika mohla být nastavena, je potřeba toto znát.

Z počátku očekávaní od testů ve všech vzdělávacích systémech byla veliká, ale pak se ukázalo, že výsledky v testech vůbec, co děti umějí v celé oblasti. Na začátku testy ukázaly, kde se výsledky dětí zlepšily, protože ty výsledky byly na začátku ve všech oblastech stejné a v některých oblastech se pak žáci zlepšili, ale už neposkytly informaci o dalších oblastech. ČR je v tomto směru o 10-15 let zpožděná a nevyužíváme zahraniční zkušenosti. Jiné země se už vrací k tomu, že se v zahraničí soustředí na podporu učitelů. A tuto zahraniční zkušenost nejsme schopni zohlednit a všechny tyto chyby budeme opět opakovat, abychom zjistili, že je to „slepá ulička“.

TF: Může tuto práci odborná komunita realizovat bez spolupráce s MŠMT?

JS: Je to možné do jisté míry, ale je to velmi neefektivní. V České republice jsou skupiny odborníků, které velmi dobře rozumí vzdělávání, například prof. Hejný, Kritické myšlení, program Heuréka apod. Máme zde know how, které má k učení co říci. Tito lidé mohou vyvinout nástroje, mohou realizovat přípravné práce, ale nemohou jim udělat takovou propagaci a podporu, aby to mělo zásadní efekt na školách. Proto je spolupráce MŠMT potřebná. Za 5 - 10 let MŠMT zjistí, že plošné testy samy o sobě nevedou k očekávaným výsledkům, budou se hledat jiná řešení, která by již v té době měla být připravena.

J. Dvořák na začátku svého vystoupení uvedl, že se bude zabývat tím, jaké jsou možnosti testování a co se z něj můžeme dozvědět. Klasický potup je, že zvolíme téma, cíle, vytvoříme úlohy a test sestavíme. Jedná se o poměrně složitý proces. Ve chvíli, kdy test použijeme a žáci obdrží určité body, je otázka, co jsme se z testu dozvěděli. Informaci, kterou získáme je v mnoha ohledech omezená, nelze odhadnout obtížnost testu, z počtu obdržených bodů přímo nelze odvodit skutečné schopnosti žáka. Každý test má jinou obtížnost, definuje škálu, na kterou žáky umisťuje a ta je ke každému testu specifická. Nelze říct, jak moc se liší schopnosti žáků, kteří získali stejný počet bodů, ale v různých testech. Lze učinit srovnání žáků v rámci jednoho testu. V tomto případě se jedná o srovnávací testy a tyto testy nemohou v žádném případě ověřit standardy.

Problematická je i porovnatelnost testů mezi roky, není možné zajistit, že žáci budou mít srovnatelné výsledky. Je tedy potřeba testy propojovat vytvořením řetězu společných úloh. Do těchto testů lze zařadit část stejných úloh.

Pokud chceme test vztáhnout k objektivně existujícím dovednostem, je potřeba je předem definovat. Dále je potřeba zajistit, aby standardu rozuměli tvůrci testů a tak aby mu „rozuměl počítač“, aby mohly být výsledky zpracovány počítačem. V tomto modelu musí být obsaženo, jak budou vypadat výstupy: 1) stanovena hranice prošel/neprošel (např. u státní maturity), 2) kategorie - například Společný evropský referenční rámec (B1, B2 …), 3) mapy učebního pokroku (MUP). MUP nám umožní vytěžit z testů více informací, ale je těžké obsáhnout celé kurikulum. Můžeme zohlednit fakt, že jedna úloha pokrývá více dovedností.

Následovat by měla fáze kalibrace (nedochází k tomu často) – empirické ověření, že nastavení modelu je správné a nastavení parametrů úloh. Kalibrace skóruje úlohy podle jejich skutečných vlastností. Také je potřeba test podle kalibrace vyhodnotit podle parametrů, které jsme určili.

Ohledně přidané hodnoty – existují dva přístupy. Jeden je relativní – např. výsledek předchozího testu, socioekonomické zázemí žáka, můžeme například srovnávat, jak se jeho zázemí projevuje na výsledku testů, můžeme porovnat žáky ze stejného prostředí a zjistit, kde se konkrétní žák pohybuje. Na základě toho lze konstatovat, že žák dosahuje nadprůměrných výsledkům vzhledem ke svému sociokulturnímu prostředí. V tomto případě lze použít srovnávací testy.

Druhý přístup je absolutní, tj. že zjistíme, co se opravdu žák naučil, o kolik se posunul v absolutních měřítcích oproti standardu. Předtím byl na úrovni B1 a nyní je na B2.

Srovnávací testy není možné použít na ověřování standardu. Dále je potřeba se ptát, jakým způsobem byly testy vztaženy ke standardu a tato metodika by měla být veřejně oponována. Co se týče srovnatelnosti, v případě státní maturity je obtížné zajistit provázanost testů, jelikož jsou zveřejňovány testové úlohy. A jejich srovnatelnost je diskutabilní. Metodiku je důležité znát, abychom věděli, jestli nám testy poskytují informace, které požadujeme, nakolik jsou tyto informace relevantní. Testy umožňují mnohé, ale jenom v případě, že bude dodržena metodika, v případě, že test je zkonstruován tak, jak má být, a pokud použijeme moderní poznatky. V zahraničí testy vznikly před 10 a více lety a při testování nebyly využity moderní poznatky.

Více v prezentaci.

TF: Pokud srovnávací testy nelze použít na ověřování standardu, je možná jejich kombinace?

JD: Možné to je. Pokud je test schopen ověřovací funkce při dodržení určité metodiky lze ho za určitých podmínek použít i pro srovnávací funkci. U použití kategorie lze zjistit, kdo spadá do kategorie A2, A1. V případě robustního modelu MUP, se může stát, že se žáci rozdělí podle skupin, test ale musí být silnější.

TF: V pilotáži byl použit test o počtu asi 13 otázek. Lze test o takovém počtu otázek použít pro ověřování standardu?
JD: Záleží na síle modelu a na rozsahu kurikula. U aktuálního testu, který tvoříme pro Společný evropský referenční rámec, pracujeme s 8 kategoriemi s 50 úlohami. V případě adaptivních způsobů testování na počítači, je možné počet úloh snížit. Počítač může na základě průběžného hodnocení přiřazovat úlohy, počítač se přizpůsobuje práci na testu. Testy jsou rozsáhlé, protože jsou nepřesné. Platí úměra čím více úloh, tím je test přesnější. Adaptivita umožňuje zpřesňovat rychleji.

TF: Pokud se nebude jednat o adaptivní test, je rozdíl v počtu otázek v papírovém provedení a na počítači?
JD: Není v tom rozdíl. Počet otázek je omezen časem, který na test mají. Neexistují výzkumy, že by byl časový rozdíl mezi prací na počítači a na papíře.

TF: Ze srovnávacích testů zjistíme, že žák je v 5. třídě v určitém percentilu a v 9. třídě je v jiném percentilu, zjistíme tak, jestli se zlepšil?
JD: Takto to není možné realizovat dostatečně přesně. Pokud použijeme ten relativní přístup k přidané hodnotě. Je to možné, že žák dosáhl nějakého skóre, např. průměru a nyní je např. nadprůměrný.

TF: Lze z toho vyvodit, kdo to způsobil? Například škola?

JD: Jestliže zvolíme vhodné indexy, očistíme data od nežádoucích vlivů a spolehneme se na statistické metody, tak v principu ano. PISA se pojišťuje tak, že data dává k dispozici, aby si to každý mohl přepočítat.

Dále T. Dvořák oslovil V. Nádvorníka, aby okomentoval, jak proběhla pilotáž na jejich škole.

V. Nádvorník: Tyto testy neověřují cíle základního vzdělávání, tyto cíle ověřují část jednoho z nich. Spíše nakolik žáci zvládli učivo. Vycházejme z toho, že to takto bylo zadáno ze strany MŠMT. Testy by měly být určeny pro žáky jako zpětná vazba. Jako žák tak mám šanci si ověřit, jak na tom jsem oproti ostatním vrstevníkům v republice. Známky na vysvědčení takto porovnatelné nejsou. I jako srovnání to může být zajímavá zpětná vazba. Když škola dostane tuto zpětnou vazbu, má příležitost se zamyslet nad tím, proč jejich žáci takto dopadli. Je to informace pro zřizovatele, aby dělal žebříček škol? Nikoliv. A vůbec ne pro MŠMT, aby podle toho poznali, kdo je dobrá škola. Na jednotlivé školy chodí děti s různým sociálním složením. Nicméně nevěřím tomu, že ministr nenechá vytvořit žebříček.

Co se týče vybavení počítači, neměla by být úplná škola v ČR, která by neměla 15 počítačů do 5 let stáří, na těchto počítačích pilotní testování fungovalo. Argument, že děti hůře zvládají test na počítači než na papíře. U 5. třídy může být problém s hodinovou dotací počítačů, i na ZŠ Londýnská, kde mají žáci dostatečný prostor pracovat s počítači, přesto byly děti, které se v dané aplikaci neorientovaly. Vznikly chyby z přehlédnutí. ZŠ Londýnská předala ČŠI seznam s připomínkami, s největší pravděpodobností budou tyto připomínky zohledněny a technické problémy (jako například malé fonty) budou do další pilotáže odstraněny.

Dále byla vyzvána M. Bihelerová, aby se podělila se svou zkušenosti s testováním svých žáků. Na ZŠ Bílé nejdříve využívali testy Scio, protože si je sami zaplatili. Posléze zřizovatel rozhodl, že zaplatí všem školám na Praze 6 tyto testy a pro všechny zřizované školy je to povinné. ZŠ dostane výsledky za třídu, za žáka, ale zároveň Scio posílá výsledky i zřizovateli. Zřizovatel vytvoří žebříček, kde je vyznačena naše škola a ostatní školy bez jmen. Daná škola ví, jak se umístili. To, že tomu nemáme přikládat důležitost, je jedna věc, ale rodiče tomu přikládají důležitost velkou. Rozdíly mezi základními školami existují, rodiče na to dávají důraz. Na ZŠ Bílá dopadáme dobře, ale možná i kdybychom nedělali téměř nic, protože máme ambiciózní rodiče a pracují s dětmi. Nelze to srovnávat například se školou ze sídliště, kde mají děti s úplně jiným zázemím. Každá škola si vystaví na webové stránky, v čem uspěli. Veřejnost bude výsledkům testů přikládat významnou důležitost. Přidaná hodnota nebude žádná, protože se bude porovnávat celá škola. Čím více máme lepších dětí, tím hůře na tom budeme v 9.třídě, protože nám odchází 30 procent dětí na gymnázia, pro naši školu bude přidaná hodnota spíše minusová.

Toto testování ještě zvýší rozdíly mezi školami. Naše školství by mělo fungovat jako „výtah“ slabých nahoru. Co má sídlištní škola dělat, když nikdy nedosáhnou stejných výsledků jako my. Existují školy, kde pořádají předběžný zápis a vybírá si žáky do prvních tříd. Už tak máme natolik selektivní vzdělávání a tímto testováním situaci ještě zhoršíme. My bychom potřebovali vzdělávat učitele, kteří pracují se slabšími žáky.

VN: Ve vyhlášce je napsáno, že máme hodnotit žáky individuálně. Tam vzniká nesoulad v souvislosti se standardem. Předpokládáme, že každému žákovi s postižením dodá test ČŠI na míru. Předpokládám, že za tímto účelem dodáváme MŠMT tabulky s těmito údaji.

V anglickém jazyce chyběla poslechová část. Proběhlo ale šetření ČŠI na vybavení počítačů na použití zvuku, tudíž předpokládám, že poslech bude zařazen.

JS: Jde o to, abychom usilovali o to, aby výsledky testů nebyly zveřejňovány, aby výsledky byly k dispozici jenom školám a učitelům jen jako zpětná vazba.

MB: Není to realistické. My na Praze 6 přesně víme, jak která škola dopadla.

Následovala diskuze.

P. Polechová: Ze strany MŠMT dochází k trojí manipulaci. Podle ministra kvalita školy = výsledky, čímž posiluje vzkaz směrem k veřejnosti, že tomu tak je. Dále dochází k manipulaci z neznalosti, neboť jak bylo řečeno, účel testu musí být jasně stanoven, neboť od toho se odvíjí jeho další nastavení. Jako příklad může být uvedeno Skotsko, kde se testuje proto, aby si učitelé ověřili, jak konkrétnímu dítěti nejlépe pomoci. Na základě testů nemají být důsledky pro nikoho. Jediný účel může být zjišťování rozdílů (např. chlapci/dívky), ale to nikdo nezamýšlí. Dále MŠMT manipuluje s informací o tom, že výzkum z Walesu přináší významný důkaz, že zrušení testů mělo důsledky pro výkonnost tamních škol. Existuje přehledová literatura o tom, že neexistuje konsensus, ale více se ví o tom, že testování má důsledky na strategické chování učitelů, na zužování kurikula, zaměření na žáky, kteří mají nejméně jisté skóre, manipulace s výsledky testů, přehodnocování existence speciálních vzdělávacích potřeb. Nám se tyto důsledky vyhnout nemohou. ČŠI obtížně může ošetřit všechny tyto vlivy.

TF: Často se hovoří v tomto směru o zužování kurikula, ale vy přece máte své pedagogické sebevědomí, tak proč byste to dělali?
V. Nádvorník: Záleží na tom, jaké sebevědomí má konkrétní škola a jaké typy rodičů do té školy děti dávají. Pokud se škola potýká na hranici svého zániku, taková škola si nemůže dovolit přijít o několik dětí ve třídě. Kolegyně ze ZŠ Londýnská, která je na stáži v USA, je tam konfrontována s ryze testovou realitou. Má učit jen to, co je požadováno ve standardizovaných testech. Sebevědomý ředitel tomu nepodlehne, těch druhých ale bude mnoho.

J. Dvořák: Chtěl bych se zastat testů, jestliže někdo použije testy nesprávným způsobem, může to mít negativní důsledky, ale není to chyba testů. Testování je nástroj, negativnímu chování lze předcházet konstrukcí testů. To vše je technicky možné, otázka je, jestli to tak bude realizováno a jestli to tak bude interpretováno.

V. Nádvorník: Stále hovoříme o testování učiva, některé cíle základního vzdělávání nelze testovat. Je potřeba říct otevřeně ze strany MŠMT, že ruší některé cíle základního vzdělávání, protože je nelze testovat. Ať tedy MŠMT řekne, že nechce RVP v této podobě a je potřeba ho změnit.

L. Martinec: Neměli bychom dávat důraz na testy. V popisu projektu NIQES je uvedeno, že v realizační fázi projekt podpoří implementaci nových inspekčních postupů pro zjišťování kvality vzdělávání. Vědí ředitelé a učitelé, že inspekční činnost v budoucnu bude založena na výsledcích těchto testů?
Minulý rok ČŠI provedla v rámci tohoto projektu výběrové řízení na statistické šetření a analýzy - propojení testování s matrikou žáků, vznikne databáze, výsledky testů, zavedení statistiky registrovaného žáka, testovaného žáka, statistika registrovaného pedagoga.

B. Brdička položil otázku do pléna, kdo zná Khan academy. Jde o daty řízené školství, kdy se bude vědět o dětech všechno, a to bude řešeno prostřednictvím technologií.¨

J. Wagner: Já mám informaci, že testy nebudou probíhat v jednu dobu a testy nebudou stejné. Z vlastní zkušenosti mohu potvrdit, že při pilotáži byly použity amatérsky udělané testy. Test měl trvat 45 minut, ale nejkratší doba vypracování testů byla 17 minut, nejdelší 22 minut. Další problém je nezájem žáků o testy.

J. Straková: Je potřeba se obávat, že testy budou mít závažné metodologické nedostatky. Je potřeba tedy usilovat o to, že tyto testy budou brány jenom jako cvičení bez nijakého významu.

V. Nádvorník: Jsem spokojen, že testy budou propojeny se školní matrikou. Nebude potřeba poskytovat informace, jaké dítě má jakou poruchu. Uživatelské rozhraní nevypadalo tak špatně. Motivace žáků je záležitost kultury školy.

TF: Nakolik budou ostré testy podobné těm, které byly použity při pilotáži?

P. Suchomel, ČŠI, upozornil, že na této akci ČŠI nezastupuje. Celá řada informací neodpovídá tomu, o co se realizátoři projektu snaží. Je velkou chybou ČŠI, že komunikuje. Testy se na papíře vypracovávat nebudou, nebude se měřit přidaná hodnota školy, žebříčky a percentily se realizovat nebudou. Testování v prosinci bylo připraveno narychlo. Aplikace zatím nevypadá dobře, ale programátoři na to neměli dostatek času. Testy byly připravovány kratší dobu, než se mají kvalitní testy připravovat. Na přelomu května a června se bude konat další kolo plošného testování, které bude probíhat na čtyřech tisících školách. Opět se budou řešit hlavně technické záležitosti, například bude řešen poslech u cizích jazyků. Přibudou 2 předměty (FJ a NJ). Standard je nastaven na minimum, testy testují elementární znalosti, úlohy se připravují za tímto účelem. Průměrný čas testů se pohybuje kolem 18 minut. Test bude výsledně rozdělen na dvě části. Nejde o zavádění dvou úrovní standardu. Lepším žákům se v druhé části zobrazí obtížnější úlohy, jde o kombinaci více dovedností. Do budoucna se uvažuje, že do budoucna by byla zavedena i třetí úroveň. V testech budou zařazeny otevřené úlohy, které nevyžadují zásah hodnotitele. Do budoucna nejspíš od roku 2014 se zásahem hodnotitele do určité míry počítá (jedna část s hodnotitelem a druhá část bez něj).

K zohlednění žáků s různými poruchami učení - ještě v květnu a červnu nebude definitivní podoba.
Nepřipravují se srovnávací testy. Laťka, ke které bude vztažen výsledek, je úroveň standardu. Co se týče testů, neprobíhá žádná pilotáž. U ověřovacího testování je potřeba zejména validní informace od oponentů. Abychom na základě výsledku nedali žákovi výsledek jako číslo, aby dostal výstup úlohu po úloze. Úloha, která se žákovi nepodařila vyřešit, zahrnovala tuto dovednost. Testy vybírají nějaké dovednosti, tak aby pokryly standard rovnoměrně. Komentář k výstupu, který by měly školy do konce ledna dostat, pomůže žákovi a jeho rodičům, kde má určitý nedostatek, který ostatní nemají.
K přidané hodnotě – ministr tvrdí, že v roce 2014 bude docházet k porovnání 5. a 9. třídy. Dokud na to budu mít vliv, budu bránit tomu, aby k tomu došlo.

Účastnice: K čemu to má celé být? Má to sloužit k tomu, že žák nesplňuje standard? Učitel se dozví něco o svém žákovi?

P. Suchomel: Bylo by možné udělat si test ze sbírky úloh ke standardu doma. Nicméně nikde nebylo řečeno, že standard byl vytvořen dobře. Je to dobrá zpětná vazba ve vývoji standardů.

JS: Jestli jsem to pochopila správně, ambice srovnávat školy není. Tato ambice se tedy vytratila? Nerozumím tomu, proč ty testy mají aspekt adaptivity? Bude dítě plnit standard na nižší a vyšší úrovni?

P. Suchomel: Ambice srovnávat školy není. Přesto mnozí ředitelé z pilotáže očekávali, že obdrží informaci o decilu. Výsledky obsahují průměry za školu a za testovanou populaci, ale je tam nepřesnost 10 percentilových bodů. Školy dostanou souhrnný výsledek testování, jak velká část škol dosáhla obdobný výsledek.

K adaptabilitě - žák se má z výsledku něco dozvědět. Výborný žák se má něco dozvědět, on se dozví, že z úloh vyšší úrovně splnil všechny, ty těžší úlohy zvládl do určité míry. Cílem není úplná adaptivita.

P. Koubek, NÚV: Je sympatické, že bude hodně oponentů základního testu i nápad, že bude použita adaptivita, že se dobrý žák dozví víc. V současném standardu nejsou dovednosti rozpracovány rovnoměrně.

J. Wagner: Bude jeden test pro všechny a v jednom čase?

P. Suchomel: Není možné, aby všichni žáci dělali testy naráz. Kolik dní bude potřeba? Podle odhadu budou na češtinu, matematiku a angličtinu potřeba 2 - 3 dny, na Fj a Nj jeden den. Různost testů bude zajištěna částečně jinými úlohami a částečně jiným pořadím úloh.

Otázky pro Českou školní inspekci:
  • Kdy budou školy znát přesný termín jarní generálky testování?
  • Plošné testování vyřadí počítačovou učebnu z běžného školního provozu na dva týdny. To je pro řadu škol problém, protože ji potřebují k výuce. Bude to ČŠI nějak řešit?
  • Co se dozvíme na základě testování kromě informace, že jeden žák neuspěl a druhý byl výborný? Jaký je smysl projektu?
  • Může ČŠI potvrdit, že se při plošném testování nebude měřit přidaná hodnota školy?
  • Bude jeden test pro všechny žáky a budou se všechny testy z jednoho předmětu vyplňovat ve stejném čase?
  • Může ČŠI zaručit, že nebude ona ani ministerstvo školství na základě výsledků testů sestavovat žebříček škol podle úspěšnosti?
  • Jakým způsobem se budou ověřovat testem neměřitelné části standardu?
  • Jakým způsobem chce ČŠI v rámci plošného testování měřit klima školy?
  • Co udělá inspekce pro to, aby se výsledky těch dětí, které v testu neuspějí, zlepšily?
  • Testovací software ČŠI má umožňovat provádění výběrových šetření. Kdy proběhne první výběrové šetření a na co bude zaměřené?

Kompletní zvukový záznam.
Videozáznam dotazů směřovaným na ČŠI.

Příští kulatý stůl se bude konat 16. února 2012 od 10 hod. v ZŠ Vodičkova.
Zapsala Silvie Pýchová

0 komentářů:

Články dle data



Učitelské listy

Nabídka práce

Česká škola - portál pro ZŠ a SŠ

Česká škola poskytuje svým čtenářům diskusní prostor k vyjádření názorů na školskou problematiku. Tyto příspěvky se nemusí shodovat se stanoviskem redakce České školy a jsou uveřejňovány jako podnět k dalším diskusím.

Obsah článků nemusí vyjadřovat stanovisko redakce nebo vydavatele Albatros Media, a.s.


Všechna práva vyhrazena.

Tento server dodržuje právní předpisy
o ochraně osobních údajů.

ISSN 1213-6018




Licence Creative Commons

Obsah podléhá licenci Creative Commons Uveďte autora-Neužívejte dílo komerčně-Nezasahujte do díla 3.0 Česká republika, pokud není uvedeno jinak nebo nejde-li o tiskové zprávy.



WebArchiv - archiv českého webu



Tyto webové stránky používají k poskytování služeb, personalizaci reklam a analýze návštěvnosti soubory cookie. Informace o tom, jak tyto webové stránky používáte, jsou sdíleny se společností Google. Používáním těchto webových stránek souhlasíte s použitím souborů cookie.