Mesures scientifiques: fiabilité et validité

La mesure est une partie importante du processus scientifique. Les aspects clés concernant la qualité des mesures scientifiques sont la fiabilité et la validité.

La fiabilité est une mesure de la cohérence interne et de la stabilité d'un appareil de mesure.

La validité nous indique si l'appareil de mesure mesure ce qu'il prétend.

La cohérence interne est le degré dans lequel les éléments ou les questions de la mesure évaluent de manière cohérente le même concept. Chaque question doit viser à mesurer la même chose. La cohérence interne est souvent mesurée à l’aide de l’alpha de Cronbach - une super-corrélation de tous les éléments de l’échelle. Si le score est de 0,70 ou plus, la mesure est acceptable. Cependant, 0,80 ou plus est préférable. Il est également important de tenir compte du contexte lors de l'examen du score qui reflète la cohérence interne.

La stabilité est souvent mesurée par la fiabilité de test / retest. La même personne passe le même test deux fois et les scores de chaque test sont comparés. Une corrélation élevée entre les deux résultats du test implique que le test est fiable. Dans la plupart des cas, une corrélation d'au moins 0,70 est considérée comme acceptable. Cependant, il s'agit d'une directive générale et non d'un test statistique.

La fiabilité inter-évaluateurs est un autre coefficient de fiabilité qui est parfois utilisé pour évaluer la fiabilité. Avec la fiabilité inter-évaluateurs, différents juges ou évaluateurs (deux ou plus) font des observations, enregistrent leurs résultats et comparent ensuite leurs observations. Si les évaluateurs sont fiables, le pourcentage d'accord devrait être élevé.

Lorsque nous demandons si une mesure est valide, nous demandons si elle mesure ce qui est censé le faire. La validité est un jugement basé sur des données collectées et non un test statistique. Il existe deux façons principales de déterminer la validité: les mesures existantes et les différences connues entre les groupes.

Le test des mesures existantes détermine si la nouvelle mesure est en corrélation avec les mesures valides pertinentes existantes. La nouvelle mesure devrait être similaire aux mesures qui ont été enregistrées avec des appareils de mesure valides déjà établis.

Les différences de groupe connues déterminent si la nouvelle mesure fait la distinction entre les différences de groupe connues. Une illustration des différences connues entre les groupes est observée lorsque différents groupes reçoivent la même mesure et sont censés obtenir des scores différents. Par exemple, si vous donniez aux démocrates et aux républicains un test évaluant la force de certaines opinions politiques, vous vous attendriez à ce qu'ils obtiennent des scores différents. Leurs points de vue sont sensiblement différents sur de nombreuses questions. Si ces deux groupes ont obtenu des scores différents, comme prévu, nous pourrions dire que la mesure indique la validité - la mesure de ce qu'elle prétend mesurer.

Lors de la conception de nouveaux appareils de mesure, il est impératif de prendre en compte leur fiabilité et leur validité. Une mesure peut être fiable et non valide. Mais une mesure valide est toujours une mesure fiable.

!-- GDPR -->