Dans le contexte d’une recherche, les concepts sont généralement appelés variables. Une variable est, comme son nom l’indique, quelque chose qui varie. L’âge, le sexe, l’exportation, les revenus et les dépenses, la taille de la famille, le pays de naissance, les dépenses en capital, les notes de classe, les lectures de pression artérielle, les niveaux d’anxiété préopératoires, la couleur des yeux et le type de véhicule sont tous des exemples de variables car chacune de ces propriétés varie ou diffère d’un individu à l’autre.
- Définition de la variable en recherche
- Types de variables
- Variables qualitatives
- Variables quantitatives
- Variables discrètes et continues
- Variable discrète
- Variable continue
- Variables dépendantes et indépendantes
- Variable indépendante
- Variable dépendante
- Niveaux d’une variable indépendante
- Variable de contexte
- Variable modératrice
- Variable étrangère
- Variable intermédiaire
- Variable suppresseur
- Concept
- Indicateur
- Construction
- Propriétés des relations entre variables
- Relation positive et négative
- Force de la relation
- Relation symétrique
- Relation causale
- Relation linéaire et non linéaire
Définition de la variable en recherche
Une variable est une propriété, une caractéristique, un nombre ou une quantité qui augmente ou diminue avec le temps ou qui peut prendre différentes valeurs (par opposition aux constantes, telles que n, qui ne varient pas) dans différentes situations.
Lors de la recherche, les expériences manipulent souvent des variables. Par exemple, un expérimentateur peut comparer l’efficacité de quatre types d’engrais.
Dans ce cas, la variable est le « type d’engrais ». Un spécialiste des sciences sociales peut examiner l’effet possible du mariage précoce sur le divorce.
Ici, le mariage précoce est la variable. Un chercheur en affaires peut trouver utile d’inclure le dividende dans la détermination du cours des actions. Ici, le dividende est la variable.
L’efficacité, le divorce et le prix des actions sont également des variables car ils varient également en raison de la manipulation des engrais, du mariage précoce et des dividendes.
Types de variables
- Variables qualitatives.
- Variables quantitatives.
- Variable discrète.
- Variable continue.
- Variables dépendantes.
- Variables indépendantes.
- Variable d’arrière-plan.
- Variable modératrice.
- Variable étrangère.
- Variable d’intervention.
- Variable suppresseur.
Variables qualitatives
Une distinction importante entre les variables est entre la variable qualitative et la variable quantitative.
Les variables qualitatives sont celles qui expriment un attribut qualitatif tel que la couleur des cheveux, la religion, la race, le sexe, le statut social, le mode de paiement, etc. Les valeurs d’une variable qualitative n’impliquent pas un ordre numérique significatif.
La valeur de la variable « religion » (musulmane, hindoue, ..,etc.) diffère qualitativement; aucun ordre de religion n’est implicite. Les variables qualitatives sont parfois appelées variables catégorielles.
Par exemple, le sexe variable a deux catégories distinctes ‘ « mâle » et « femelle. »Puisque les valeurs de cette variable sont exprimées en catégories, nous appelons cela une variable catégorielle.
De même, le lieu de résidence peut être classé comme étant urbain et rural et constitue donc une variable catégorielle.
Les variables catégorielles peuvent à nouveau être décrites comme nominales et ordinales.
Les variables ordinales sont celles qui peuvent être logiquement ordonnées ou classées plus ou moins élevées qu’une autre, mais qui n’établissent pas nécessairement une différence numérique entre chaque catégorie, comme les notes d’examen (A+, A, B+, etc., taille des vêtements (Extra large, grand, moyen, petit).
Les variables nominales sont celles qui ne peuvent être ni classées ni ordonnées logiquement, telles que la religion, le sexe, etc.
Une variable qualitative est une caractéristique qui ne peut pas être mesurée mais qui peut être classée comme possédant ou non certaines caractéristiques.
Variables quantitatives
Les variables quantitatives, également appelées variables numériques, sont les variables qui sont mesurées en termes de nombres. Un exemple simple de variable quantitative est l’âge d’une personne.
L’âge peut prendre des valeurs différentes car une personne peut avoir 20 ans, 35 ans, etc. De même, la taille de la famille est une variable quantitative, car une famille peut être composée d’un, deux, trois membres, etc.
C’est-à-dire que chacune de ces propriétés ou caractéristiques mentionnées ci-dessus varie ou diffère d’un individu à l’autre. Notez que ces variables sont exprimées en nombres, pour lesquels nous les appelons variables quantitatives ou parfois numériques.
Une variable quantitative est une variable pour laquelle les observations résultantes sont numériques et possède donc un ordre ou un classement naturel.
Variables discrètes et continues
Les variables quantitatives sont à nouveau de deux types : discrètes et continues.
Les variables telles que certains enfants dans un ménage ou le nombre d’articles défectueux dans une boîte sont des variables discrètes puisque les scores possibles sont discrets sur l’échelle.
Par exemple, un ménage peut avoir trois ou cinq enfants, mais pas 4,52 enfants.
D’autres variables, telles que « temps nécessaire pour terminer un test QCM » et » temps d’attente dans une file d’attente devant un comptoir bancaire », sont des exemples de variable continue.
Le temps requis dans les exemples ci-dessus est une variable continue, qui peut être, par exemple, de 1,65 minute, ou de 1,6584795214 minute.
Bien entendu, les aspects pratiques de la mesure empêchent la plupart des variables mesurées d’être continues.
Variable discrète
Définition 2.6: Une variable discrète, limitée à certaines valeurs, se compose généralement (mais pas nécessairement) de nombres entiers, tels que la taille de la famille, le nombre d’articles défectueux dans une boîte. Ils sont souvent le résultat d’un dénombrement ou d’un comptage.
Quelques exemples supplémentaires sont;
- Le nombre d’accidents au cours des douze mois.
- Le nombre de cartes mobiles vendues dans un magasin dans les sept jours.
- Le nombre de patients admis dans un hôpital sur une période déterminée.
- Le nombre de nouvelles succursales d’une banque ouvertes chaque année entre 2001 et 2007.
- Le nombre de visites hebdomadaires effectuées par le personnel de santé au cours des 12 derniers mois.
Variable continue
Une variable continue est une variable qui peut prendre un nombre infini de valeurs intermédiaires le long d’un intervalle spécifié. Les exemples sont:
- Le taux de sucre dans le corps humain;
- Lecture de la pression artérielle;
- Température;
- Taille ou poids du corps humain;
- Taux d’intérêt bancaire;
- Taux de rendement interne (TRI),
- Rapport de gain (ER);
- Rapport de courant (CR)
Peu importe la proximité de deux observations, si l’instrument de mesure est suffisamment précis, une troisième observation peut être trouvée, qui se situera entre les deux premières.
Une variable continue résulte généralement de la mesure et peut prendre d’innombrables valeurs dans la plage spécifiée.
Variables dépendantes et indépendantes
Dans de nombreux contextes de recherche, il existe deux classes spécifiques de variables qu’il faut distinguer les unes des autres, la variable indépendante et la variable dépendante.
De nombreuses études de recherche visent à découvrir et à comprendre les causes des phénomènes ou problèmes sous-jacents dans le but ultime d’établir une relation de causalité entre eux.
Regardez les déclarations suivantes:
- Une faible consommation d’aliments provoque une insuffisance pondérale.
- Le tabagisme augmente le risque de cancer du poumon.
- Le niveau d’éducation influence la satisfaction au travail.
- La publicité aide à la promotion des ventes.
- Le médicament provoque l’amélioration d’un problème de santé.
- L’intervention infirmière provoque une récupération plus rapide.
- Les expériences de travail antérieures déterminent le salaire initial.
- Les bleuets ralentissent le vieillissement.
- Le dividende par action détermine le cours de l’action.
Dans chacune des requêtes ci-dessus, nous avons deux variables : une indépendante et une dépendante. Dans le premier exemple, « une faible consommation de nourriture » est censée avoir causé le « problème de l’insuffisance pondérale ».’
C’est donc la variable dite indépendante. L’insuffisance pondérale est la variable dépendante car nous pensons que ce « problème » (le problème de l’insuffisance pondérale) a été causé par « la faible consommation de nourriture » (le facteur).
De même, le tabagisme, les dividendes et la publicité sont tous des variables indépendantes, et le cancer du poumon, la satisfaction au travail et les ventes sont des variables dépendantes.
En général, une variable indépendante est manipulée par l’expérimentateur ou le chercheur, et ses effets sur la variable dépendante sont mesurés.
Variable indépendante
La variable utilisée pour décrire ou mesurer le facteur supposé causer ou au moins influencer le problème ou le résultat est appelée variable indépendante.
La définition implique que l’expérimentateur utilise la variable indépendante pour décrire ou expliquer l’influence ou l’effet de celle-ci sur la variable dépendante.
La variabilité de la variable dépendante est présumée dépendre de la variabilité de la variable indépendante.
Selon le contexte, une variable indépendante est parfois appelée variable prédictive, régresseuse, variable contrôlée, variable manipulée, variable explicative, variable d’exposition (utilisée dans la théorie de la fiabilité), facteur de risque (utilisé dans les statistiques médicales), caractéristique (utilisée dans l’apprentissage automatique et la reconnaissance de formes) ou variable d’entrée.
La variable explicative est préférée par certains auteurs à la variable indépendante lorsque les quantités traitées comme des variables indépendantes peuvent ne pas être statistiquement indépendantes ou manipulables indépendamment par le chercheur.
Si la variable indépendante est appelée variable explicative, alors le terme variable de réponse est préféré par certains auteurs pour la variable dépendante.
Variable dépendante
La variable utilisée pour décrire ou mesurer le problème ou le résultat à l’étude est appelée variable dépendante.
Dans une relation causale, la cause est la variable indépendante et l’effet est la variable dépendante. Si nous émettons l’hypothèse que le tabagisme cause le cancer du poumon, le « tabagisme » est la variable indépendante et le cancer la variable dépendante.
Un chercheur en affaires peut trouver utile d’inclure le dividende dans la détermination du cours des actions. Ici, le dividende est la variable indépendante, tandis que le cours de l’action est la variable dépendante.
La variable dépendante est généralement la variable que le chercheur souhaite comprendre, expliquer ou prédire.
Dans la recherche sur le cancer du poumon, c’est le carcinome qui intéresse réellement le chercheur, pas le comportement tabagique en soi. La variable indépendante est la cause présumée, l’antécédent ou l’influence sur la variable dépendante.
Selon le contexte, une variable dépendante est parfois appelée variable de réponse, régression, variable prédite, variable mesurée, variable expliquée, variable expérimentale, variable de réponse, variable de résultat, variable de sortie ou étiquette.
Certains auteurs préfèrent une variable expliquée à la variable dépendante lorsque les quantités traitées comme des variables dépendantes peuvent ne pas être statistiquement dépendantes.
Si la variable dépendante est appelée variable expliquée, alors le terme variable prédictive est préféré par certains auteurs pour la variable indépendante.
Niveaux d’une variable indépendante
Si un expérimentateur compare un traitement expérimental à un traitement témoin, alors la variable indépendante (un type de traitement) a deux niveaux: expérimental et contrôle.
Si une expérience devait comparer cinq types de régimes, alors les variables indépendantes (types de régimes) auraient cinq niveaux.
En général, le nombre de niveaux d’une variable indépendante est le nombre de conditions expérimentales.
Variable de contexte
Dans presque toutes les études, nous recueillons des informations telles que l’âge, le sexe, le niveau de scolarité, le statut socio-économique, l’état matrimonial, la religion, le lieu de naissance, etc. Ces variables sont appelées variables de fond.
Ces variables sont souvent liées à de nombreuses variables indépendantes de sorte qu’elles influencent indirectement le problème. Elles sont donc appelées variables d’arrière-plan.
Si les variables de fond sont importantes pour l’étude, elles doivent être mesurées. Cependant, nous devrions essayer de limiter le plus possible le nombre de variables de fond dans l’intérêt de l’économie.
Variable modératrice
Dans toute déclaration de relations de variables, on suppose normalement que d’une certaine manière, la variable indépendante « provoque » la variable dépendante. Dans les relations simples, toutes les autres variables sont étrangères et sont ignorées. Dans des situations d’étude réelles, une relation individuelle aussi simple doit être révisée pour prendre en compte d’autres variables afin de mieux expliquer la relation.
Cela souligne la nécessité de considérer une deuxième variable indépendante qui devrait avoir un effet contributif ou conditionnel important sur la relation dépendance-indépendante initialement indiquée. Une telle variable est appelée variable modératrice.
Supposons que vous étudiez l’impact de la formation sur le terrain et en classe sur la performance au travail des travailleurs de la santé et de la planification familiale, vous considérez le type de formation comme la variable indépendante.
Si vous vous concentrez sur la relation entre l’âge des stagiaires et la performance au travail, vous pouvez utiliser le « type de formation » comme variable modératrice.
Variable étrangère
La plupart des études concernent l’identification d’une seule variable indépendante et la mesure de son effet sur la variable dépendante.
Cependant, plusieurs variables pourraient affecter notre relation hypothétique de variables indépendantes dépendantes, faussant ainsi l’étude. Ces variables sont appelées variables étrangères.
Les variables étrangères ne font pas nécessairement partie de l’étude. Ils exercent un effet de confusion sur la relation dépendante-indépendante et doivent donc être éliminés ou contrôlés.
Un exemple peut illustrer le concept de variables étrangères. Supposons que nous souhaitions examiner la relation entre le statut professionnel des mères et la durée de l’allaitement.
Il n’est pas déraisonnable dans ce cas de supposer que le niveau d’éducation des mères, tel qu’il influence le statut professionnel, pourrait également avoir un impact sur la durée de l’allaitement.
L’éducation est ici traitée comme une variable étrangère. Dans toute tentative d’éliminer ou de contrôler l’effet de cette variable, nous pouvons considérer cette variable comme une variable confondante.
Une façon appropriée de traiter les variables confusionnelles consiste à suivre la procédure de stratification, qui implique une analyse séparée pour les différents niveaux de variables confusionnelles de mensonges.
Pour cela, on peut construire deux tableaux croisés : l’un pour les mères analphabètes et l’autre pour les mères alphabétisées. Si nous trouvons une association similaire entre l’état de travail et la durée de l’allaitement chez les deux groupes de mères, nous concluons que le niveau d’éducation des mères n’est pas une variable confondante.
Variable intermédiaire
Souvent, une relation apparente entre deux variables est causée par une troisième variable.
Par exemple, les variables X et Y peuvent être fortement corrélées, mais uniquement parce que X provoque la troisième variable, Z, qui à son tour provoque Y. Dans ce cas, Z est la variable intermédiaire.
Une variable intermédiaire affecte théoriquement les phénomènes observés mais ne peut être vue, mesurée ou manipulée directement ; ses effets ne peuvent être déduits que des effets des variables indépendantes et modératrices sur les phénomènes observés.
Dans la relation travail-statut et allaitement, nous pourrions considérer la motivation ou le conseil comme la variable intermédiaire.
Ainsi, le motif, la satisfaction au travail, la responsabilité, le comportement, la justice sont quelques-uns des exemples de variables intermédiaires.
Variable suppresseur
Dans de nombreux cas, nous avons de bonnes raisons de croire que les variables d’intérêt ont une relation en elles-mêmes, mais nos données ne parviennent pas à établir une telle relation. Certains facteurs cachés peuvent supprimer la vraie relation entre les deux variables d’origine.
Un tel facteur est appelé variable suppresseur car il supprime la relation réelle entre les deux autres variables.
La variable suppresseur supprime la relation en étant corrélée positivement avec l’une des variables de la relation et corrélée négativement avec l’autre. La relation vraie entre les deux variables réapparaîtra lorsque la variable suppresseur est contrôlée.
Ainsi, par exemple, le faible âge peut tirer l’éducation vers le haut mais le revenu vers le bas. En revanche, un âge élevé peut tirer le revenu vers le haut mais le niveau de scolarité vers le bas, annulant ainsi la relation entre le niveau de scolarité et le revenu, à moins que l’âge ne soit contrôlé.
Concept
Le concept est un nom donné à une catégorie qui organise les observations et les idées par leur possession de caractéristiques communes. Comme Bulmer le dit succinctement, les concepts sont des catégories pour l’organisation des idées et des observations (Bulmer, 1984:43).
Si un concept doit être utilisé dans la recherche quantitative, il devra être mesuré. Une fois mesurés, les concepts peuvent prendre la forme de variables indépendantes ou dépendantes.
En d’autres termes, les concepts peuvent expliquer (variable explicative) un certain aspect du monde social, ou ils peuvent représenter des choses que nous voulons expliquer (variable dépendante).
Des exemples de concepts sont la mobilité sociale, l’orthodoxie religieuse, la classe sociale, la culture, le mode de vie, la réussite scolaire, etc.
Indicateur
Un indicateur est une mesure utilisée pour désigner un concept lorsqu’aucune mesure directe n’est disponible. Nous utilisons des indicateurs pour exploiter des concepts moins directement quantifiables.
Pour comprendre ce qu’est un indicateur, il convient de faire une distinction entre une mesure et un indicateur. Un indicateur peut être utilisé pour désigner des éléments comptés de manière relativement claire, tels que le revenu, l’âge, le nombre d’enfants, etc.
Les mesures, en d’autres termes, sont des quantités. Si nous nous intéressons à certaines des causes de variation des revenus, ces dernières peuvent être quantifiées de manière raisonnablement directe.
Nous utilisons des indicateurs pour exploiter des concepts moins directement quantifiables. Si nous nous intéressons aux causes de variation de la satisfaction au travail, nous aurons besoin d’indicateurs qui représenteront le concept.
Ces indicateurs permettent de mesurer la satisfaction au travail, et nous pouvons traiter les informations quantitatives résultantes comme s’il s’agissait d’une mesure.
Un indicateur est donc quelque chose qui est conçu ou qui existe déjà, et qui est utilisé comme s’il s’agissait d’une mesure d’un concept.
Il est considéré comme une mesure indirecte d’un concept, comme la satisfaction au travail. Un QI est un autre exemple, en ce sens qu’il s’agit d’une batterie d’indicateurs du concept d’intelligence.
Construction
Une construction est une abstraction ou un concept qui est délibérément inventé ou construit par un chercheur à des fins scientifiques.
Dans une théorie scientifique, en particulier en psychologie, une construction hypothétique est une variable explicative qui n’est pas directement observable.
Par exemple, les concepts d’intelligence et de motivation sont utilisés pour expliquer les phénomènes en psychologie, mais aucun n’est directement observable.
Une construction hypothétique diffère d’une variable intermédiaire en ce que la construction a des propriétés et des implications qui n’ont pas été démontrées dans la recherche empirique. Ceux-ci servent de guide pour d’autres recherches. Une variable intermédiaire, en revanche, est un résumé des résultats empiriques observés.
Cronbach et Meehl (1955) définissent une construction hypothétique comme un concept pour lequel il n’y a pas un seul référent observable, qui ne peut pas être observé directement, et pour lequel il existe plusieurs référents, mais aucun tout compris.
Par exemple, selon Cronbach et Meehl, un poisson n’est pas une construction hypothétique car, malgré la variation des espèces et des variétés de poissons, il existe une définition convenue pour un poisson avec des caractéristiques spécifiques qui distinguent un poisson d’un oiseau.
De plus, les poissons peuvent être directement observés.
D’un autre côté, une construction hypothétique n’a pas de référent unique; plutôt, les constructions hypothétiques consistent en des groupes de comportements, d’attitudes, de processus et d’expériences fonctionnellement liés.
Au lieu de voir l’intelligence, l’amour ou la peur, nous voyons des indicateurs ou des manifestations de ce que nous avons convenu d’appeler l’intelligence, l’amour ou la peur.
Autres exemples de constructions :
- En Biologie : Gènes, évolution, maladie, taxonomie, immunité
- En Physique/Astrophysique : Trous noirs, Big Bang, Matière Noire, Théorie des cordes, physique moléculaire ou atomes, gravité, centre de masse
- En Psychologie : Intelligence ou connaissance, émotions, personnalité, humeurs.
Propriétés des relations entre variables
En traitant des relations entre variables dans la recherche, nous observons une variété de dimensions dans ces relations. Nous en discutons quelques-uns ci-dessous.
Relation positive et négative
Deux variables ou plus peuvent avoir une relation positive, négative ou aucune relation du tout. Dans le cas de deux variables, une relation positive est une relation dans laquelle les deux variables varient dans la même direction.
Cependant, lorsqu’ils varient dans des directions opposées, on dit qu’ils ont une relation négative. Lorsqu’un changement de l’autre variable n’accompagne pas le changement ou le mouvement d’une variable, nous disons que les variables en question ne sont pas liées.
Par exemple, si une augmentation de son taux de salaire accompagne son expérience de travail, la relation entre l’expérience de travail et le taux de salaire est positive.
Si une augmentation du niveau d’éducation d’un individu diminue son désir d’enfants supplémentaires, la relation est négative ou inverse. Si le niveau d’éducation n’a aucune incidence sur le désir, nous disons que les variables « désir d’enfants supplémentaires » et « éducation » ne sont pas liées.
Force de la relation
Une fois qu’il a été établi que deux variables sont effectivement liées, nous voulons déterminer dans quelle mesure elles sont liées.
Une statistique courante pour mesurer la force d’une relation est le coefficient de corrélation symbolisé par r. r est une mesure sans unité, comprise entre -1 et +1 inclus, zéro signifiant aucune relation linéaire.
En ce qui concerne la prédiction d’une variable à partir de la connaissance de l’autre variable, une valeur de r = + 1 signifie une précision de 100% dans la prédiction d’une relation positive entre les deux variables et une valeur de r =-1 signifie une précision de 100% dans la prédiction d’une relation négative entre les deux variables.
Relation symétrique
Jusqu’à présent, nous n’avons discuté que des relations symétriques dans lesquelles un changement de l’autre variable accompagne un changement de l’une ou l’autre variable. Cette relation n’indique pas quelle variable est la variable indépendante et quelle variable est la variable dépendante.
En d’autres termes, vous pouvez étiqueter l’une des variables comme la variable indépendante.
Une telle relation est une relation symétrique. Dans une relation asymétrique, le changement de la variable X (disons) s’accompagne d’un changement de la variable Y, mais pas l’inverse.
La quantité de précipitations, par exemple, augmentera la productivité, mais la productivité n’affectera pas les précipitations. C’est une relation asymétrique.
De même, la relation entre le tabagisme et le cancer du poumon serait asymétrique car le tabagisme pourrait causer le cancer, mais le cancer du poumon ne pourrait pas causer le tabagisme.
Relation causale
L’indication d’une relation entre deux variables ne garantit pas automatiquement que les changements dans une variable entraînent des changements dans une autre variable.
Il est cependant très difficile d’établir l’existence d’une causalité entre les variables. Bien que personne ne puisse jamais être certain que la variable A provoque l’apparition de la variable B, on peut néanmoins recueillir des preuves qui augmentent notre croyance que A mène à B.
Pour tenter de le faire, nous recherchons les preuves suivantes:
- Existe-t-il une relation entre A et B? Lorsque de telles preuves existent, elles indiquent un lien de causalité possible entre les variables.
- La relation est-elle asymétrique de sorte qu’un changement de A entraîne un changement de B mais pas l’inverse? En d’autres termes, A se produit-il avant B? Si nous constatons que B se produit avant A, nous pouvons avoir peu de confiance que A provoque
- Un changement de A entraîne-t-il un changement de B quelles que soient les actions d’autres facteurs? Ou en d’autres termes, est-il possible d’éliminer d’autres causes possibles de B? Peut-on déterminer que C, D et E (disons) ne co-varient pas avec B d’une manière qui suggère des connexions causales possibles?
Relation linéaire et non linéaire
Une relation linéaire est une relation droite entre deux variables, où les variables varient au même rythme, que les valeurs soient faibles, élevées ou intermédiaires.
Ceci contraste avec les relations non linéaires (ou curvilignes) où la vitesse à laquelle une variable change de valeur peut être différente pour différentes valeurs de la seconde variable.
On peut simplement déterminer si une variable est linéairement liée à l’autre variable ou non en traçant les valeurs K par rapport aux valeurs X. Si les valeurs, lorsqu’elles sont tracées, semblent se situer sur une ligne droite, l’existence d’une relation linéaire entre X et Y est suggérée.
La taille et le poids ont presque toujours une relation approximativement linéaire, tandis que l’âge et les taux de fécondité ont une relation non linéaire.