L’une des questions les plus courantes que me posent les personnes effectuant des enquêtes sur le développement international est « quelle devrait être la taille de mon échantillon?”. Bien qu’il existe de nombreux calculateurs de taille d’échantillon et guides statistiques disponibles, ceux qui n’ont jamais fait de statistiques à l’université (ou qui ont tout oublié) peuvent les trouver intimidants ou difficiles à utiliser.
Si cela vous ressemble, continuez à lire. Ce guide expliquera comment choisir une taille d’échantillon pour une enquête de base sans aucune des formules compliquées. Pour des règles empiriques plus simples concernant la taille des échantillons pour d’autres situations, je recommande fortement la taille de l’échantillon: Un guide approximatif de Ronán Conroy et Le Manuel de recherche par sondage de Pamela Alreck et Robert Settle.
Ce conseil s’adresse à:
- Enquêtes de base telles que formulaires de feedback, évaluations des besoins, enquêtes d’opinion, etc. réalisé dans le cadre d’un programme.
- Enquêtes utilisant un échantillonnage aléatoire.
Ce conseil n’est PAS pour:
- Études de recherche menées par des universités, des cabinets de recherche, etc.
- Enquêtes complexes ou de très grande envergure, telles que les enquêtes nationales auprès des ménages.
- Enquêtes pour comparer entre un groupe d’intervention et un groupe témoin ou avant et après un programme (pour cette situation Taille de l’échantillon: Un guide approximatif).
- Enquêtes utilisant un échantillonnage non aléatoire, ou un type particulier d’échantillonnage tel que l’échantillonnage en grappes ou stratifié (pour ces situations, voir Taille de l’échantillon: Guide approximatif et lignes directrices des Nations Unies sur les enquêtes auprès des ménages).
- Enquêtes dans lesquelles vous prévoyez d’utiliser des statistiques fantaisistes pour analyser les résultats, telles que l’analyse multivariée (si vous savez comment faire de telles statistiques fantaisistes, vous devriez déjà savoir comment choisir une taille d’échantillon).
- La taille minimale de l’échantillon est de 100
- Une bonne taille d’échantillon maximale est généralement de 10% tant qu’elle ne dépasse pas 1000
- Choisissez un nombre entre le minimum et le maximum en fonction de la situation
- Si vous voulez être un peu plus scientifique, utilisez ce tableau
- Détendez-vous et arrêtez de vous soucier des formules
La taille minimale de l’échantillon est de 100
La plupart des statisticiens conviennent que la taille minimale de l’échantillon pour obtenir un résultat significatif est de 100. Si votre population est inférieure à 100, vous devez vraiment les sonder tous.
Une bonne taille d’échantillon maximale est généralement de 10% tant qu’elle ne dépasse pas 1000
Une bonne taille d’échantillon maximale est généralement d’environ 10% de la population, tant que cela ne dépasse pas 1000. Par exemple, dans une population de 5000 personnes, 10% seraient 500. Dans une population de 200 000 habitants, 10% seraient 20 000. Cela dépasse 1000, donc dans ce cas, le maximum serait de 1000.
Même dans une population de 200 000 personnes, l’échantillonnage de 1 000 personnes donnera normalement un résultat assez précis. L’échantillonnage de plus de 1000 personnes n’ajoutera pas beaucoup à la précision compte tenu du temps et de l’argent supplémentaires que cela coûterait.
Choisissez un nombre entre le minimum et le maximum en fonction de la situation
Supposons que vous souhaitiez sonder les élèves d’une école qui compte 6000 élèves inscrits. L’échantillon minimum serait de 100. Cela vous donnerait une idée approximative, mais toujours utile, de leurs opinions. L’échantillon maximum serait de 600, ce qui vous donnerait une idée assez précise de leurs opinions.
Choisissez un nombre plus proche du minimum si:
- Vous avez peu de temps et d’argent.
- Vous n’avez besoin que d’une estimation approximative des résultats.
- Vous ne prévoyez pas de diviser l’échantillon en différents groupes pendant l’analyse, ou vous prévoyez seulement d’utiliser quelques grands sous-groupes (par exemple, les hommes / les femmes).
- Vous pensez que la plupart des gens donneront des réponses similaires.
- Les décisions qui seront prises sur la base des résultats n’ont pas de conséquences significatives.
Choisissez un nombre plus proche du maximum si:
- Vous avez le temps et l’argent pour le faire.
- Il est très important d’obtenir des résultats précis.
- Vous prévoyez de diviser l’échantillon en plusieurs groupes différents pendant l’analyse (par ex. différents groupes d’âge, niveaux socio-économiques, etc.).
- Vous pensez que les gens sont susceptibles de donner des réponses très différentes.
- Les décisions qui seront prises sur la base des résultats de l’enquête sont importantes, coûteuses ou ont de graves conséquences.
En pratique, la plupart des gens veulent normalement que les résultats soient aussi précis que possible, de sorte que le facteur limitant est généralement le temps et l’argent. Dans l’exemple ci-dessus, si vous aviez le temps et l’argent pour sonder les 600 étudiants, cela vous donnera un résultat assez précis. Si vous n’avez pas assez de temps ou d’argent, choisissez simplement le plus grand nombre que vous puissiez gérer, à condition qu’il soit supérieur à 100.
Si vous voulez être un peu plus scientifique, utilisez ce tableau
Alors que les règles empiriques précédentes sont parfaitement acceptables pour la plupart des enquêtes de base, vous devez parfois paraître plus « scientifique” pour être pris au sérieux. Dans ce cas, vous pouvez utiliser le tableau suivant. Choisissez simplement la colonne qui correspond le mieux à la taille de votre population. Ensuite, choisissez la ligne qui correspond au niveau d’erreur que vous êtes prêt à accepter dans les résultats.
Vous verrez sur ce tableau que les plus petits échantillons sont encore autour de 100, et que le plus grand échantillon (pour une population de plus de 5000) est toujours autour de 1000. Les mêmes principes généraux s’appliquent qu’auparavant – si vous envisagez de diviser les résultats en de nombreux sous-groupes, ou si les décisions à prendre sont très importantes, vous devriez choisir un échantillon plus important.
Remarque : Ce tableau ne peut être utilisé que pour les enquêtes de base afin de mesurer la proportion de la population ayant une caractéristique particulière (p. ex. quelle proportion d’agriculteurs utilisent des engrais, quelle proportion de femmes croient aux mythes sur la planification familiale, etc.). Il ne peut pas être utilisé si vous essayez de comparer deux groupes (par exemple, le contrôle par rapport à l’intervention) ou deux points dans le temps (par exemple, les enquêtes de base et de fin). Voir Taille de l’échantillon : Un guide approximatif pour d’autres tableaux qui peuvent être utilisés dans ces cas.
Détendez-vous et arrêtez de vous soucier des formules
C’est un sale petit secret chez les statisticiens que les formules de taille d’échantillon exigent souvent que vous ayez à l’avance des informations que vous n’avez normalement pas. Par exemple, vous devez généralement savoir (en termes numériques) dans quelle mesure les réponses à l’enquête sont susceptibles de varier d’une personne à l’autre (si vous le saviez à l’avance, vous ne feriez pas d’enquête!).
Ainsi, même s’il est théoriquement possible de calculer la taille d’un échantillon à l’aide d’une formule, dans de nombreux cas, les experts finissent toujours par s’appuyer sur des règles empiriques ainsi que sur beaucoup de bon sens et de pragmatisme. Cela signifie que vous ne devriez pas trop vous inquiéter si vous ne pouvez pas utiliser des mathématiques sophistiquées pour choisir la taille de votre échantillon – vous êtes en bonne compagnie.
Une fois que vous avez choisi une taille d’échantillon, n’oubliez pas de rédiger de bonnes questions d’enquête, de concevoir correctement le formulaire d’enquête, de pré-tester et de piloter votre questionnaire.
Photo de James Cridland