Una delle domande più comuni che mi vengono poste da persone che fanno sondaggi nello sviluppo internazionale è ” quanto dovrebbe essere grande la mia dimensione del campione?”. Mentre ci sono molti calcolatori di dimensioni del campione e guide statistiche disponibili, coloro che non hanno mai fatto statistiche all’università (o hanno dimenticato tutto) possono trovarli intimidatorio o difficile da usare.
Se questo suona come te, continua a leggere. Questa guida spiegherà come scegliere una dimensione del campione per un sondaggio di base senza nessuna delle formule complicate. Per regole pratiche più semplici per quanto riguarda le dimensioni del campione per altre situazioni, consiglio vivamente Sample size: A rough guide di Ronán Conroy e The Survey Research Handbook di Pamela Alreck e Robert Settle.
Questo consiglio è per:
- Sondaggi di base come moduli di feedback, valutazioni dei bisogni, sondaggi di opinione, ecc. condotto come parte di un programma.
- Indagini che utilizzano il campionamento casuale.
Questo consiglio NON è per:
- Studi di ricerca condotti da università, società di ricerca, ecc.
- Indagini complesse o molto ampie, come le indagini nazionali sulle famiglie.
- Indagini da confrontare tra un gruppo di intervento e di controllo o prima e dopo un programma (per questa situazione Dimensione del campione: Una guida approssimativa).
- Indagini che utilizzano il campionamento non casuale, o un tipo speciale di campionamento come cluster o campionamento stratificato (per queste situazioni si veda Sample size: A rough guide and the UN guidelines on household surveys).
- Sondaggi in cui si prevede di utilizzare statistiche fantasiose per analizzare i risultati, come l’analisi multivariata (se si sa come fare tali statistiche fantasiose, allora si dovrebbe già sapere come scegliere una dimensione del campione).
- La dimensione minima del campione è 100
- Una buona dimensione massima del campione è di solito del 10% purché non superi 1000
- Scegli un numero tra il minimo e il massimo a seconda della situazione
- Se vuoi essere un po ‘ più scientifico, usa questa tabella
- Rilassati e smetti di preoccuparti delle formule
La dimensione minima del campione è 100
La maggior parte degli statistici concorda sul fatto che la dimensione minima del campione per ottenere qualsiasi tipo di risultato significativo è 100. Se la tua popolazione è inferiore a 100, devi davvero esaminarli tutti.
Una buona dimensione massima del campione è di solito del 10% purché non superi 1000
Una buona dimensione massima del campione è di solito intorno al 10% della popolazione, purché non superi 1000. Ad esempio, in una popolazione di 5000, il 10% sarebbe 500. In una popolazione di 200.000, il 10% sarebbe 20.000. Questo supera 1000, quindi in questo caso il massimo sarebbe 1000.
Anche in una popolazione di 200.000, il campionamento di 1000 persone normalmente darà un risultato abbastanza accurato. Campionare più di 1000 persone non aggiungerà molto alla precisione dato il tempo e il denaro extra che costerebbe.
Scegli un numero tra il minimo e il massimo a seconda della situazione
Supponiamo di voler esaminare gli studenti di una scuola che ha 6000 alunni iscritti. Il campione minimo sarebbe 100. Questo ti darebbe un’idea approssimativa, ma comunque utile, delle loro opinioni. Il campione massimo sarebbe 600, che ti darebbe un’idea abbastanza accurata delle loro opinioni.
Scegli un numero più vicino al minimo se:
- Hai tempo e denaro limitati.
- Hai solo bisogno di una stima approssimativa dei risultati.
- Non si prevede di dividere il campione in gruppi diversi durante l’analisi, o si prevede solo di utilizzare alcuni sottogruppi di grandi dimensioni (ad esempio maschi / femmine).
- Pensi che la maggior parte delle persone darà risposte simili.
- Le decisioni che verranno prese in base ai risultati non hanno conseguenze significative.
Scegli un numero più vicino al massimo se:
- Hai tempo e denaro per farlo.
- È molto importante ottenere risultati accurati.
- Si prevede di dividere il campione in molti gruppi diversi durante l’analisi (ad es. diverse fasce d’età, livelli socio-economici, ecc.).
- Pensi che le persone possano dare risposte molto diverse.
- Le decisioni che verranno prese in base ai risultati del sondaggio sono importanti, costose o hanno gravi conseguenze.
In pratica la maggior parte delle persone normalmente desidera che i risultati siano il più accurati possibile, quindi il fattore limitante è solitamente tempo e denaro. Nell’esempio sopra, se hai avuto il tempo e il denaro per esaminare tutti gli studenti 600, questo ti darà un risultato abbastanza accurato. Se non hai abbastanza tempo o denaro, scegli il numero più grande che puoi gestire, purché sia più di 100.
Se vuoi essere un po ‘ più scientifico, usa questa tabella
Mentre le precedenti regole empiriche sono perfettamente accettabili per la maggior parte dei sondaggi di base, a volte devi sembrare più “scientifico” per essere preso sul serio. In tal caso è possibile utilizzare la seguente tabella. Basta scegliere la colonna che più si adatta alle dimensioni della popolazione. Quindi scegli la riga che corrisponde al livello di errore che sei disposto ad accettare nei risultati.
Vedrai in questa tabella che i campioni più piccoli sono ancora intorno a 100, e il campione più grande (per una popolazione di oltre 5000) è ancora intorno a 1000. Gli stessi principi generali si applicano come prima – se si prevede di dividere i risultati in un sacco di sottogruppi, o le decisioni da prendere sono molto importanti, si dovrebbe scegliere un campione più grande.
Nota: Questa tabella può essere utilizzata solo per indagini di base per misurare quale percentuale della popolazione ha una caratteristica particolare (ad es. quale percentuale di agricoltori utilizza fertilizzanti, quale percentuale di donne crede ai miti sulla pianificazione familiare, ecc.). Non può essere utilizzato se si sta tentando di confrontare due gruppi (ad esempio controllo contro intervento) o due punti nel tempo (ad esempio indagini di base e di fine linea). Vedere Dimensione del campione: una guida approssimativa per altre tabelle che possono essere utilizzate in questi casi.
Rilassati e smetti di preoccuparti delle formule
È un piccolo segreto tra gli statistici che le formule di dimensione del campione spesso richiedono di avere informazioni in anticipo che normalmente non hai. Ad esempio, in genere è necessario sapere (in termini numerici) quanto le risposte nel sondaggio possono variare tra gli individui (se lo sapessi in anticipo, non faresti un sondaggio!).
Quindi, anche se è teoricamente possibile calcolare una dimensione del campione usando una formula, in molti casi gli esperti finiscono ancora per fare affidamento su regole empiriche più una buona dose di buon senso e pragmatismo. Ciò significa che non dovresti preoccuparti troppo se non puoi usare la matematica di fantasia per scegliere la dimensione del campione: sei in buona compagnia.
Una volta che hai scelto una dimensione del campione, non dimenticare di scrivere buone domande di indagine, progettare il modulo di indagine correttamente e pre-test e pilotare il questionario.
Foto di James Cridland