Jedním z nejčastějších otázek, jsem se zeptal lidí dělá průzkumy v oblasti mezinárodního rozvoje, je „jak velká by moje velikost vzorku?”. I když existuje mnoho velikost vzorku kalkulačky a statistické příručky k dispozici, ti, kteří nikdy dělal statistiky na univerzitě (nebo zapomněli to všechno) může najít je zastrašující nebo obtížné používat.
pokud to zní jako vy, pokračujte ve čtení. Tato příručka vysvětlí, jak vybrat velikost vzorku pro základní průzkum bez složitých vzorců. Pro snadnější pravidla týkající se velikostí vzorků pro jiné situace vřele doporučuji velikost vzorku: hrubý průvodce Ronán Conroy a Příručka průzkumu výzkumu Pamela Alreck a Robert Settle.
Tato rada je:
- Základní průzkumy jako zpětná vazba formuláře, posouzení potřeb, průzkumy veřejného mínění, atd. provádí se jako součást programu.
- průzkumy, které používají náhodné vzorkování.
tato rada není určena:
- výzkumné studie prováděné univerzitami, výzkumnými firmami atd.
- komplexní nebo velmi rozsáhlé průzkumy, jako jsou národní průzkumy domácností.
- průzkumy pro porovnání mezi Intervenční a kontrolní skupinou nebo před a po programu (pro tuto situaci velikost vzorku: hrubý průvodce).
- Průzkumy, které používají non-náhodný výběr, nebo speciální typ vzorků jako je například cluster nebo stratifikované vzorkování (pro tyto situace vidět velikost Vzorku: hrubé vodítko a pokynů OSN pro domácnost průzkumy).
- Průzkumy, kde máte v plánu použít nóbl statistiky, analyzovat výsledky, jako jsou multivariační analýzu (pokud víte, jak na takové nóbl statistiky, pak byste měli už vědět, jak vybrat velikost vzorku).
minimální velikost vzorku je 100
většina statistiků souhlasí s tím, že minimální velikost vzorku pro získání jakéhokoli smysluplného výsledku je 100. Pokud je vaše populace menší než 100, musíte je skutečně prozkoumat.
maximální velikost vzorku je obvykle 10%, pokud to nepřesahuje 1000
maximální velikost vzorku je obvykle kolem 10% populace, tak dlouho, jak to nepřesahuje 1000. Například v populaci 5000 by 10% bylo 500. V populaci 200 000 by 10% bylo 20 000. To přesahuje 1000, takže v tomto případě by maximum bylo 1000.
i v populaci 200 000, odběr vzorků 1000 lidí obvykle poskytne poměrně přesný výsledek. Odběr vzorků více než 1000 lidí nepřidá moc na přesnosti vzhledem k času a peněz navíc by to stálo.
Vyberte číslo mezi minimální a maximální, v závislosti na situaci
Předpokládejme, že chcete průzkum studentů na škole, která má 6000 žáků. Minimální Vzorek by byl 100. To by vám hrubý, ale stále užitečné, představu o jejich názorech. Maximální Vzorek by byl 600, což by vám dalo poměrně přesnou představu o jejich názorech.
Vyberte číslo blíže minimu, pokud:
- máte omezený čas a peníze.
- potřebujete pouze hrubý odhad výsledků.
- během analýzy neplánujete rozdělit vzorek do různých skupin nebo plánujete použít pouze několik velkých podskupin (např.
- Myslíte si, že většina lidí dá podobné odpovědi.
- rozhodnutí, která budou učiněna na základě výsledků, nemají významné důsledky.
Vyberte číslo blíže k maximu, pokud:
- máte čas a peníze na to.
- je velmi důležité získat přesné výsledky.
- máte v plánu rozdělit vzorek do mnoha různých skupin během analýzy (např. různé věkové skupiny, socioekonomické úrovně atd.).
- Myslíte si, že lidé budou pravděpodobně dávat velmi odlišné odpovědi.
- rozhodnutí, která budou učiněna na základě výsledků průzkumu, jsou důležitá, drahá nebo mají vážné důsledky.
v praxi většina lidí obvykle chce, aby výsledky byly co nejpřesnější, takže omezujícím faktorem je obvykle čas a peníze. Ve výše uvedeném příkladu, pokud jste měli čas a peníze na průzkum všech 600 studentů, pak vám to dá docela přesný výsledek. Pokud nemáte dostatek času nebo peněz, stačí vybrat největší číslo, které můžete spravovat, pokud je to více než 100.
Pokud chcete být trochu více vědeckých a pak pomocí této tabulky
Zatímco předchozí pravidla jsou naprosto přijatelné pro většinu základních průzkumů, někdy budete potřebovat, aby to znělo více „vědecké“, aby mohly být brány vážně. V takovém případě můžete použít následující tabulku. Jednoduše vyberte sloupec, který nejvíce odpovídá velikosti vaší populace. Poté vyberte řádek, který odpovídá úrovni chyby, kterou jste ochotni přijmout ve výsledcích.
v této tabulce uvidíte, že nejmenší vzorky jsou stále kolem 100 a největší vzorek (pro populaci více než 5000) je stále kolem 1000. Platí stejné obecné zásady jako dříve – pokud plánujete rozdělit výsledky do mnoha podskupin nebo jsou rozhodnutí, která mají být učiněna, velmi důležitá, měli byste vybrat větší vzorek.
Poznámka: tuto tabulku lze použít pouze pro základní průzkumy k měření toho, jaký podíl populace má určitou charakteristiku (např. jaký podíl zemědělců používá hnojivo, jaký podíl žen věří mýtům o plánování rodiny atd.). Nelze jej použít, pokud se pokoušíte porovnat dvě skupiny (např. kontrola versus intervence) nebo dva časové body (např. základní a koncové průzkumy). Viz Velikost vzorku: hrubý průvodce pro další tabulky, které lze v těchto případech použít.
uvolněte se a přestaňte se starat o vzorce
mezi statistiky je špinavé malé tajemství, že vzorce velikosti vzorku často vyžadují, abyste měli předem informace, které normálně nemáte. Například obvykle potřebujete vědět (v číselném vyjádření), kolik odpovědí v průzkumu se pravděpodobně bude lišit mezi jednotlivci (pokud jste to věděli předem, pak byste nedělali průzkum!).
i když je to teoreticky možné vypočítat velikost vzorku pomocí vzorce, v mnoha případech, odborníci stále skončit spoléhat pravidla palce, plus hodně zdravého rozumu a pragmatismu. To znamená, že byste se neměli příliš bát, pokud nemůžete použít fantastickou matematiku k výběru velikosti vzorku – jste v dobré společnosti.
jakmile si vyberete velikost vzorku, nezapomeňte napsat dobré dotazníkové otázky, správně navrhnout formulář průzkumu a předem otestovat a pilotovat dotazník.
Foto James Cridland