Dans cette troisième unité de l’atelier, vous êtes appelé à distinguer les variables et les principaux types de statistiques retrouvés dans les articles, en plus d’interpréter des résultats.
Comment vous sentez-vous lorsque vous lisez la section des résultats d’un article scientifique dans lequel on parle de corrélation, d’écarts-types, de risque relatif, d’intervalle de confiance à 95 % ou encore, de résultats significatifs avec un p < 0,001?
Évaluer votre niveau de confort dans ce domaine :
Si vous éprouvez un certain degré de malaise à la lecture des résultats dans un article scientifique, vous n’êtes pas seul!
Pourtant, la maîtrise des connaissances de base en statistique est une compétence essentielle pour intégrer la pratique fondée sur les données probantes à votre pratique.
Cette unité vous permettra de mieux comprendre les résultats statistiques en maîtrisant quelques concepts généraux et vous outillera pour développer votre sens critique à la lecture des articles que vous serez appelés à consulter.
Peu importe comment les résultats sont présentés, afin d’en comprendre le sens, quelques termes clés doivent d’abord être bien compris.
Plongeons lentement dans le sujet en expliquant les termes les plus pertinents.
En recherche quantitative, une variable est une mesure qui peut prendre plusieurs valeurs et qui souvent, possède une unité de mesure.
Êtes-vous en mesure d’en nommer quelques-unes?
La première étape pour bien comprendre les statistiques consiste à bien distinguer les niveaux de mesure des variables. Il existe principalement trois niveaux de mesure des variables :
info_outline Consigne : cliquez sur le symbole de la loupe pour en savoir davantage sur les niveaux de mesure.
Variable qui contient deux catégories ou plus et est définie grâce à des nombres souvent arbitraires, soit des nombres qui permettent de classer les catégories d’une variable.
Seules les fréquences ou les proportions (en %) peuvent être utilisées pour rapporter les résultats issus d’une variable nominale.
Variable qui contient trois catégories ou plus et est définie grâce à des nombres parfois arbitraires, mais qui donnent un certain ordre de grandeur.
Les fréquences et les proportions (en %) sont souvent utilisées pour rapporter les résultats issus d’une variable ordinale.
Variable qui est définie grâce à des nombres peu arbitraires qui offrent le plus grand nombre de possibilités d’analyse.
La moyenne est la statistique la plus souvent rapportée lorsque l’on traite une variable cardinale.
À noter : Les variables de niveau cardinal sont parfois appelées variables métriques. Vous verrez aussi parfois variables d’intervalles et variables de rapport.
info_outline Consigne : cliquez sur chaque boîte de dialogue pour obtenir une définition plus complète des concepts.
Maintenant que vous connaissez mieux les variables et leurs niveaux de mesures, essayons de mieux comprendre ce qu’elles tentent de nous dire à l’intérieur des résultats d’une étude.
Essentiellement, les résultats découlant des variables nous permettent de mieux comprendre le phénomène étudié en présentant au moins l’un de ces trois éléments :
Voyons en détail ces trois concepts.
Les études cherchent à décrire, de la façon la plus simple possible, l’ensemble des données qui composent une variable.
Très peu d’études quantitatives cherchent uniquement à décrire un phénomène. Mais presque toutes les études quantitatives contiennent des éléments descriptifs pour mieux contextualiser l’étude.
Fréquence (Frequency) : Nombre d’occurrences d’un événement dans une période déterminée.
Plus précisément, une statistique comme la fréquence nous aide à situer l’importance qu’occupent les catégories d’une variable nominale ou ordinale.
Une mesure de tendance centrale comme la moyenne permet de résumer en un seul point l’ensemble des données d’une variable cardinale.
Mesure de tendance centrale (Measure of central tendency) : Valeur numérique déterminée comme représentative de la valeur qui est au centre d’une série statistique. Les mesures de tendance centrale les plus connues sont le mode, la médiane et la moyenne.
Moyenne (Mean) : Mesure de tendance centrale calculée en divisant la somme de toutes les valeurs observées par le nombre d’observations.
La moyenne est souvent accompagnée d’une mesure de dispersion comme l’écart-type pour nous indiquer où se situe l’ensemble des données autour de cette moyenne.
Mesure de dispersion (Measure of dispersion) : Pour une série d’observations statistiques, indication ou indice établi pour exprimer leur éloignement les unes des autres.
Écart-type (Standard deviation) : Mesure de dispersion qui indique où se trouvent la plupart des individus de l’échantillon autour de la moyenne. On sait qu’environ 68 % des individus d’un échantillon se retrouvent à l’intérieur de ± 1 écart-type.
Courbe normale (Normal curve) : Courbe utilisée pour représenter graphiquement des données d’une série statistique de distribution normale, c’est-à-dire dont la grandeur ou le comportement ne dépend que du hasard.
Visionnez cette capsule vidéo si vous souhaitez en savoir plus sur l’écart-type et la courbe normale.
Allons voir si vous pouvez reconnaître ces statistiques descriptives retrouvées dans un article scientifique.
Montoro, Thombs et Igartua (2015) ont cherché à définir les liens entre l’orientation sexuelle, le harcèlement et l’idée suicidaire chez les jeunes de 14 à 18 ans du Québec. Voici quelques éléments descriptifs de l’échantillon.
Extrait provenant de la section « Caractéristiques de l’échantillon »
« Tel qu’il est indiqué dans le tableau 1 911 élèves (49 %) étaient âgés de 16 ans ou plus, 913 (49 %) étaient de sexe féminin et 1 195 (65 %) étaient de race blanche. »
1a) Tentez de discerner les variables.
Les trois variables, ainsi que les catégories qui les composent sont :
Variable | Catégories |
---|---|
Âge |
16 ans ou plus |
Sexe |
Féminin |
Race |
Blanc |
info_outline Consignes :
1b) Tentez maintenant de discerner le niveau de mesure de chacune de ces variables :
Voici le niveau de mesure de ces trois variables :
Les statistiques descriptives sont souvent présentées dans un tableau. Allons décortiquer un exemple de plus près.
Bonanséa, Monthuy-Blanc, Aimé, Therme et Maïano (2016) ont voulu comparer les attitudes et les comportements alimentaires inappropriés ainsi que les caractéristiques psychosociales en fonction de deux niveaux de pratique sportive, soit intensive et de loisir. Avant de comparer les attitudes et les comportements alimentaires inappropriés selon la pratique sportive, les auteurs ont apporté quelques précisions sur les groupes à l’étude avec quelques statistiques descriptives. Cette portion du tableau cherche donc à décrire quelques paramètres anthropométriques et sportifs pour les deux pratiques sportives, soit de niveau intensif ou de loisir.
Données anthropométriques / sportives |
Intensif (n = 88) |
Loisir (n = 58) |
Total (n = 146) |
|||
M ± ET |
M ± ET |
M ± ET |
||||
Âge (années) |
17,06 ± 1,26 |
16,33 ± 1,72 |
16,77± 1,50 |
|||
IMC (kg/m2) |
22,23 ± 4,19 |
19,75 ± 2,01 |
21,24 ± 3,69 |
|||
Catégorie de poids |
N |
% |
N |
% |
N |
% |
Insuffisance pondérale |
12 |
13,64 % |
13 |
22,41 % |
25 |
17,12 % |
Poids normal |
55 |
62,50 % |
44 |
75,86 % |
99 |
67,81 % |
Surpoids |
17 |
19,32 % |
1 |
1,72 % |
18 |
12,33 % |
Obésité |
4 |
4,55 % |
0 |
- |
4 |
2,74 % |
Types de pratiques sportives |
||||||
Judo |
50 |
56,82 % |
18 |
31,03 % |
68 |
46,58 % |
Taekwondo |
11 |
12,05 % |
13 |
22,41 % |
24 |
16,44 % |
Gymnastique |
6 |
6,82 % |
7 |
12,07 % |
13 |
8,90 % |
Nage synchronisée |
5 |
5,68 % |
6 |
10,35 % |
11 |
7,53 % |
Athlétisme |
16 |
1,82 % |
14 |
24,14 % |
30 |
20,55 % |
Tentez de discerner :
info_outline Consignes :
Les quatre variables à l’intérieur de la colonne « Données anthropométriques/sportives » | Le niveau de mesure de ces quatre variables |
---|---|
Les quatre variables à l’intérieur de la colonne « Données anthropométriques/sportives » | Le niveau de mesure de ces quatre variables |
---|---|
Âge |
Niveau de mesure cardinal. On y présente la moyenne et l’écart-type. |
IMC |
Niveau de mesure cardinal. On y présente la moyenne et l’écart-type. |
Catégorie de poids |
Niveau de mesure ordinal. Il y a un ordre de grandeur dans les catégories listées. |
Types de pratiques sportives |
Niveau de mesure nominal. Les catégories listées n’ont aucun ordre de grandeur. |
Maintenant que vous êtes plus familier avec les statistiques descriptives, allons voir comment les relations entre les variables sont communiquées dans les écrits scientifiques.
À l’exception des études descriptives, presque toutes les études cherchent à mettre en relation deux ou plusieurs variables.
Les statistiques qui résument une relation entre deux ou plusieurs variables nous permettent en fait de définir le lien qui unit ou non ces variables.
Plus précisément, une variable dépendante est mise en relation la plupart du temps avec une ou plusieurs variables indépendantes.
Variable dépendante (Dependent variable) : La variable dépendante (VD) est liée à l’objet de recherche. C’est la variable passive, encore appelée variable réponse, parce qu’elle indique le phénomène que le chercheur essaie d’expliquer.
Variable indépendante ou expérimentale (Independent ou Experimental variable) : Variable souvent manipulée par le chercheur pour observer ou mesurer ses effets sur la variable dépendante.
Pour mieux illustrer ceci, prenons en exemple une population avec plusieurs facteurs de risque de développer un diabète de type II. Une équipe de recherche cherche à savoir si une nouvelle intervention permet de minimiser les cas de diabètes au sein de cette population.
Par exemple, ce modèle a été créé pour répondre à la question suivante :
Pourriez-vous repérer les variables indépendante et dépendante?
Variable indépendante :
Variable dépendante :
Variable indépendante : il s’agit de la variable intervention qui est composée des groupes intervention et contrôle
Variable dépendante : il s’agit de la variable diabète qui comprend les diabétiques et les non-diabétiques.
Une fois que nous avons repéré les variables indépendante et dépendante, différents types de statistiques sont utilisés pour définir l’existence de lien ou non entre ces variables.
Les statistiques utilisées pour définir une relation entre deux variables dépendent du niveau de mesure des variables, soit nominal, ordinal ou cardinal.
Si on reprend l’exemple précédent, pouvez-vous déceler :
Dans les deux cas, il s’agit de variables de niveau nominal. La variable intervention contient deux groupes, soit intervention et contrôle. La variable diabète contient aussi deux groupes, soit diabétiques et non-diabétiques.
Quelques exemples de statistiques de relation que nous approfondirons sont :
Les rapports de cotes ou les risques relatifs permettent de décrire une relation entre deux variables nominales.
Rapport de cotes (Odds Ratio) : Mesure du lien entre l’exposition à un facteur de risque et l’apparition d’une atteinte. Plus précisément, il s’agit du rapport (quotient) entre la cote d’exposition chez les cas (sujets malades ou décédés, par exemple) et chez les témoins (sujets non malades ou vivants, par exemple).
Risque relatif (Relative risk) : Mesure du lien entre l’exposition à un facteur de risque et l’apparition d’une atteinte. Plus précisément, il s’agit du rapport (quotient) entre le risque de survenue d’un événement chez les sujets exposés à un facteur donné et le risque de survenue de cet événement chez les sujets non exposés à ce facteur.
Dans l’exemple reliant l’intervention au diabète, le rapport de cote ou le risque relatif serait donc la statistique de relation appropriée.
Voici un exemple de résultat qui utilise un indice de risque relatif pour définir une relation.
Contexte :
On cherche à savoir si une nouvelle intervention permet de prévenir les cas de diabète chez une population présentant plusieurs facteurs de risque. Un rappel que la variable intervention et la variable diabète sont toutes deux de niveau nominal.
Résultat fictif :
Selon les résultats illustrés dans cet exemple, les individus faisant partie du groupe contrôle ont un risque relatif 2,5 fois plus élevé d’être diabétiques que ceux faisant partie du groupe intervention.
Interprétation :
Ce résultat suggère qu’il existe un lien entre les variables intervention et diabète. En d’autres mots, les cas de diabète diffèrent selon l’appartenance au groupe contrôle ou intervention. De façon plus concrète, la nouvelle intervention semble atténuer la présence de nouveau cas de diabète.
Les corrélations de Pearson permettent de décrire une relation entre deux variables cardinales.
Voici un exemple de résultat qui utilise un coefficient de corrélation pour définir une relation.
Contexte :
Des cliniciens veulent savoir si l’indice de masse corporelle (en kg/m2) et la glycémie à jeun (mMol/L) sont reliés chez une population adulte et sédentaire. Pour ce faire, on obtient des résultats pour dix participants. Un rappel que l’indice de masse corporelle et la glycémie à jeun sont deux variables de niveau cardinal.
Résultat fictif :
Selon les résultats illustrés dans cet exemple, le niveau de glycémie à jeun est modérément corrélé en fonction de l’indice de masse corporelle chez les individus avec un surplus de poids (r = 0,484).
Interprétation :
Ce résultat suggère qu’il existe un lien entre les variables indice de masse corporelle et glycémie à jeun. En d’autres mots, plus l’indice de masse corporelle est élevé, plus la glycémie à jeun est élevée également.
Les comparaisons des moyennes permettent de décrire une relation entre une variable cardinale et une variable nominale contenant de deux à cinq groupes.
Voici un exemple de résultat qui utilise la comparaison entre les moyennes pour définir une relation.
Contexte :
On cherche à savoir si une nouvelle intervention permet de diminuer la glycémie à jeun (en mMol/L) chez des individus atteints de diabète de type II. Pour ce faire, on compare les résultats du groupe intervention à celui du groupe contrôle. Un rappel que la glycémie est une variable cardinale alors que l’intervention est une variable nominale.
Résultat fictif :
Selon les résultats illustrés dans cet exemple, le niveau de glycémie à jeun est légèrement plus élevé pour le groupe contrôle (6,7 ± 1,2 mMol/L) comparativement au groupe intervention (6,0 ± 0,9 mMol/L).
Interprétation :
Puisque les moyennes diffèrent entre les deux groupes, ces résultats suggèrent qu’il existe un lien entre les variables intervention et glycémie à jeun. En fait, la glycémie moyenne du groupe intervention est un peu plus basse que celle du groupe contrôle. Toutefois, l’ajout de statistique déductive s’avèrera nécessaire pour conclure si cette différence est réelle. Nous reviendrons plus en détail sur cet élément plus loin dans l’unité.
Nous nous pencherons sur ces différentes statistiques de relation dans la prochaine partie.
Après les prochaines sections, vous serez en mesure de mieux reconnaître :
Les rapports de cotes (RC) ou les risques relatifs (RR) sont souvent utilisés lorsque l’on veut connaître le lien entre une intervention et un diagnostic.
Ce type de statistique permet de décrire une relation entre deux variables nominales dichotomiques.
La plupart du temps, les RC ou les RR sont construits à partir d’un tableau de contingence qui a ce format :
info_outline Consigne : cliquez sur le symbole pour afficher les variables.
À titre d’exemple, une analyse pourrait conclure que les probabilités d’être atteint d’un cancer sont 3,6 fois plus élevées chez les fumeurs que chez les non-fumeurs. On indiquerait donc un rapport de cotes comme ceci : RC = 3,59. (Même si RC = 3,59, soit une valeur avec deux décimales, on utilise la valeur arrondie 3,6.)
RC = 3,59 |
||
Tabagisme |
Cancer |
|
Atteint d’un cancer |
Pas atteint d’un cancer |
|
Fumeurs |
63 (a) |
42 (b) |
Non-fumeurs |
28 (c) |
67 (d) |
Tentons de décortiquer les rapports de cotes retrouvés dans un article scientifique.
Montoro et ses collaborateurs (2015) ont cherché à définir les liens entre l’orientation sexuelle, le harcèlement et l’idée suicidaire chez les jeunes de 14 à 18 ans du Québec.
Notes :
« …les élèves s’identifiant comme hétérosexuels sans attirance ou comportement envers le même sexe étaient presque trois fois plus susceptibles de mentionner des idées suicidaires lorsqu’ils étaient victimes de harcèlement, que le même groupe sans harcèlement (RC = 2,76, IC 95 % = 2,06 à 3,69, p < ,001). Les élèves non hétérosexuels ne subissant aucun harcèlement étaient presque quatre fois plus susceptibles (RC = 3,97, IC 95 % = 2,26 à 6,97, p < ,001); et les élèves non-hétérosexuels ayant mentionné du harcèlement étaient plus de huit fois plus susceptibles (RC = 8,13, IC 95 % = 4,68 à 14,15, p < ,001). »
Extrait tiré de l’article de Montoro et al., 2015.
Les trois rapports de cotes (RC) décrivent trois relations. Pour les trois cas, la conséquence indésirable est l’idée suicidaire. Pour les trois cas également, le groupe « hétérosexuel non victime de harcèlement » est le groupe de référence, soit le groupe non exposé au risque.
Sachant cela, saurez-vous indiquer les groupes exposés au risque pour chaque rapport de cotes (RC)?
info_outline Consignes :
RC = 2,76 |
||
Facteur de risque |
Idée suicidaire |
|
Oui |
Non |
|
Hétérosexuel non victime de harcèlement La bonne réponse est Hétérosexuel victime de harcèlement. Note : le facteur « harcèlement » est isolé. La bonne réponse est Hétérosexuel victime de harcèlement. Note : le facteur « harcèlement » est isolé. |
98 135 |
289 1098 |
RC = 3,97 |
||
Facteur de risque |
Idée suicidaire |
|
Oui |
Non |
|
Hétérosexuel non victime de harcèlement La bonne réponse est Non-hétérosexuel non victime de harcèlement. Note : le facteur « orientation sexuel » est isolé. La bonne réponse est Non-hétérosexuel non victime de harcèlement. Note : le facteur « orientation sexuel » est isolé. |
20 135 |
41 1098 |
RC = 8,13 |
||
Facteur de risque |
Idée suicidaire |
|
Oui |
Non |
|
Hétérosexuel non victime de harcèlement La bonne réponse est Non-hétérosexuel victime de harcèlement. Note : les facteurs « orientation sexuel » et « harcèlement » sont imbriqués dans la comparaison. La bonne réponse est Non-hétérosexuel victime de harcèlement. Note : les facteurs « orientation sexuel » et « harcèlement » sont imbriqués dans la comparaison. |
28 135 |
28 1098 |
Revenons avec l’exemple où les résultats stipulaient que les probabilités d’être atteint d’un cancer sont 3,6 fois plus élevées chez les fumeurs que chez les non-fumeurs (RC = 3,59).
Voici un exemple de tableau de contingence qui aurait permis d’arriver à ce constat.
Sous le tableau, vous avez les équations mathématiques qui expliquent comment les RC ou le RR sont calculés. (Celles-ci ne sont jamais indiquées dans un article. Nous vous les illustrons pour vous expliquer le processus.)
Tableau fictif illustrant les cas de cancer en fonction du tabagisme pour un échantillon quelconque
Tabagisme |
Cancer |
|
Atteint d’un cancer |
Pas atteint d’un cancer |
|
Fumeurs |
n=63 (a) |
n=42 (b) |
Non-fumeurs |
n=28 (c) |
n=67 (d) |
Vous vous questionnez sur ce qui distingue le rapport de cotes du risque relatif? Consultez ce document .
Les corrélations de Pearson peuvent être présentées de deux façons :
Le coefficient de corrélation (r) a la particularité de varier entre -1 et +1.
Une valeur de -1 illustre une relation négative parfaite.
Une valeur de +1 illustre une relation positive parfaite.
Une valeur de 0 illustre une absence de relation entre les deux variables.
L’activité qui suit vous permettra d’attribuer le bon coefficient de corrélation de Pearson au bon nuage de points.
Allons voir si vous saurez associer le bon coefficient de corrélation au bon nuage de points.
info_outline Consignes :
Voici quelques indicateurs permettant d’interpréter des coefficients de corrélations.
Un coefficient où :
Décrit une relation négative parfaite et le nuage de points ressemble à :
Décrit une absence de relation et le nuage de points ressemble à :
Décrit une relation positive parfaite et le nuage de points ressemble à :
Tentons d’interpréter les résultats provenant d’une corrélation retrouvée dans les écrits scientifiques.
Temfemo, Doutrellot et Ahmaidi (2008) ont cherché à comparer les effets de deux types d’intervention sur le renforcement musculaire chez les patients qui ont reçu une prothèse totale de hanche.
Dans la figure qui suit, les auteurs ont voulu mettre en relation la force isométrique du moyen fessier avec l’activité électromyographie du même muscle.
Notes :
Figure provenant de la section des résultats
D’autres types de corrélations sont utilisés pour mesurer les relations entre des variables ordinales ou une variable ordinale et une variable cardinale.
Par exemple, on peut évoquer la corrélation de Spearman ou encore la corrélation Tau, pour ne nommer que celles-là. S’il y a des différences dans les formules mathématiques utilisées pour calculer le coefficient de ces relations, l’interprétation que l’on en fait est similaire à celle que nous venons d’expliquer pour les corrélations de Pearson. C’est-à-dire qu’une valeur de zéro signifie qu’il n’y a pas de relation alors que des valeurs se rapprochant de 1,0 et de -1,0 signifient des relations fortes.
Les comparaisons entre les moyennes permettent de décrire une relation lorsque :
La variable dépendante est de niveau cardinal.
La variable indépendante est de niveau nominal.
Souvent, la variable nominale contient de deux à quatre catégories (groupes) selon l’étude.
Lorsque l’on compare des moyennes entre des groupes, on compare les moyennes et les écarts-types.
Si vous voyez les termes test-t, analyse de variance ou ANOVA à la lecture d’un article scientifique, il s’agit de tests statistiques qui permettent la comparaison entre les moyennes.
Les tests-t permettent de comparer les moyennes entre deux groupes.
Normalement, ceci implique que la variable indépendante est de niveau nominal avec deux catégories.
L’ANOVA est l’acronyme pour « analyse de variance ». L’ANOVA est habituellement employée lorsque l’on compare les moyennes entre trois groupes ou plus.
Donc, que ce soit test-t ou ANOVA, vous savez que :
Allons voir si vous pouvez interpréter une comparaison entre les moyennes à l’intérieur d’une figure.
Temfemo et al. (2008) ont cherché à comparer les effets de deux types d’intervention sur le renforcement musculaire chez les patients avec une prothèse totale de hanche.
Dans la figure qui suit, les auteurs ont mis en relation le temps de maintien (en secondes) par rapport au moment des tests et par rapport au type d’intervention.
Maintenant, cette relation observée à T3 est-elle réelle pour l’ensemble de la population? Les statistiques déductives, que nous verrons ci-dessous, nous permettent de répondre à cette question.
info_outline Consigne : cliquez sur le symbole pour agrandir l’image.
Dans la section précédente, nous avons porté attention à trois types de relation couramment observés dans les écrits, soit :
Une fois que nous avons pris connaissance de la relation entre les variables, on veut savoir si ce que nous observons est applicable à la population générale.
Ce sont les statistiques déductives qui nous permettent de répondre à cette question.
Une fois qu’une relation entre deux variables est décrite, on cherche à déduire si elle est généralisable ou réelle pour la population ciblée.
Voilà pourquoi les statistiques de relation sont habituellement suivies des statistiques de déduction.
En fait, les statistiques de déduction permettent de répondre à la question suivante.
D’ordre général, on peut catégoriser les statistiques déductives en deux types principaux.
D’abord, il y a l’estimation de paramètres qui utilise les intervalles de confiance (p. ex. on retrouve régulièrement des intervalles de confiance à 95 % dans les écrits).
Ou encore, il y a les tests d’hypothèses qui utilisent les lois de la probabilité avec une marge d’erreur qui est souvent de 5 %. En fait, c’est à partir des tests d’hypothèse que l’on retrouve le fameux p < 0,05.
Nous approfondirons les concepts d’intervalles de confiance et de tests d’hypothèses à la prochaine section.
Comment déduire si ce que l’on observe à l’intérieur d’un échantillon est représentatif pour la population ciblée?
Nous nous pencherons sur deux stratégies statistiques souvent utilisées en recherche quantitative pour répondre à cette question.
En général, on veut avoir moins de 5 % de risques de se tromper lorsqu’on dit que l’on peut généraliser les résultats à l’ensemble de la population étudiée. Il s’agit d’une convention généralement acceptée, mais d’autres valeurs pourraient être utilisées dans certaines recherches. Voici donc les deux stratégies :
Supposons que vous vous intéressez au tabagisme chez les fumeurs âgés 18 à 35 ans.
Votre échantillon contient 50 individus qui, en moyenne, consomment 6 cigarettes / jour et le calcul de l'intervalle de confiance à 95 % donne entre 3,7 et 8,3 cigarettes / jour.
Ceci signifie que vous pouvez être confiant à 95 % que le nombre réel de cigarettes consommées par jour en moyenne chez les fumeurs âgés entre 18 et 35 ans se situe entre 3,7 et 8,3.
info_outline Consignes :
Les fumeurs sont trois fois plus à risque de développer le cancer des poumons que les non-fumeurs (p < 0,001)
Ces résultats nous indiquent que le lien entre le tabagisme (fumeurs et non-fumeurs) et les cas de cancer des poumons est réel pour la population ciblée, car p < 0,001. Il y donc moins de 1 chance sur 1000 de se tromper en l'affirmant.
Les fumeurs sont trois fois plus à risque de développer le cancer des poumons que les non-fumeurs (p = 0,273)
Ces résultats nous indiquent que même si une tendance est observée, le lien entre le tabagisme et le cancer des poumons n'est pas confirmé, car la valeur de p n'est pas statistiquement significative (p = 0,273).
Maintenant que vous comprenez mieux les intervalles de confiance et les tests d’hypothèses, tentez d’interpréter ces résultats qui comprennent des statistiques de relation et de déduction.
Pour une cohorte atteinte du syndrome métabolique, les individus faisant partie du groupe contrôle ont un risque relatif 2,5 fois plus élevé d’être diabétiques que ceux faisant partie du groupe intervention (IC 95 % = 1,3 à 4,2).
Pour l’échantillon en question, on sait que le risque relatif d’être diabétique est 2,5 fois plus élevé pour les individus du groupe contrôle que pour les individus ayant reçu la nouvelle intervention. Grâce à l’intervalle de confiance à 95 %, on sait que le risque relatif réel pour cette population se situe entre 1,3 et 4,2.
Le niveau de glycémie à jeun est modérément corrélé en fonction de l’indice de masse corporelle chez les individus avec un surplus de poids (r = 0,458 ; p < 0,01).
Pour l’échantillon, on sait que la glycémie à jeun et l’indice de masse corporelle sont liés avec un coefficient de corrélation où r = 0,458. Comme nous l’avons vu, ce lien peut être considéré de force modérée. Puisque p < 0,01, on a moins de 1 % de chance de se tromper en affirmant que le lien entre la glycémie à jeun et l’indice de masse corporelle est réel pour cette population.
Le niveau de glycémie à jeun est légèrement plus élevé pour le groupe contrôle (6,8 ± 1,3 mMol/L) comparativement au groupe intervention (5,9 ± 1,7 mMol/L) (p < 0,05). .
Pour l’échantillon, on voit bien que la glycémie moyenne n’est pas la même en fonction du type d’intervention. Puisque p < 0,05, on a moins de 5 % de chance de se tromper en affirmant que le type d’intervention est lié à la glycémie pour cette population.
Maintenant que vous connaissez le niveau de mesure des variables ainsi que les statistiques descriptives, de relation et déductives, tentez d’interpréter ces résultats provenant d’articles scientifiques.
Tentez d’interpréter les résultats qui comprennent des rapports de cote. Pour ce faire, reprenons l’extrait de l’article de Montoro et ses collaborateurs (2015) sur les liens entre l’orientation sexuelle, le harcèlement et l’idée suicidaire chez les jeunes de 14 à 18 ans du Québec.
« ...les élèves s’identifiant comme hétérosexuels sans attirance ou comportement envers le même sexe étaient presque trois fois plus susceptibles de mentionner des idées suicidaires lorsqu’ils étaient victimes de harcèlement, que le même groupe sans harcèlement (RC = 2,76, IC 95 % = 2,06 à 3,69, p < ,001). Les élèves non hétérosexuels ne subissant aucun harcèlement étaient presque quatre fois plus susceptibles (RC = 3,97, IC 95 % = 2,26 à 6,97, p < ,001); et les élèves non-hétérosexuels ayant mentionné du harcèlement étaient plus de huit fois plus susceptibles (RC = 8,13, IC 95 % = 4,68 à 14,15, p < ,001). »
Extrait tiré de l’article de Montoro et al., 2015.
RC = 2,76
Les probabilités d’avoir une idée suicidaire sont 2,8 fois plus élevées pour les victimes de harcèlement comparativement à ceux qui n’ont pas été victimes chez les hétérosexuels sans attirance pour le même sexe.
IC 95 % = 2,06 à 3,69
Nous pouvons être confiants à 95 % que le rapport de cote réel pour cette population ciblée se situe entre 2,06 et 3,69.
p < ,001
Puisque p < 0,001, il y a moins d’une chance sur 1 000 que ce lien ne soit pas réel pour cette population ciblée.
RC = 3,97
Chez les participants qui n’ont pas vécu de harcèlement, les probabilités d’avoir une idée suicidaire sont 4 fois plus élevées pour les non-hétérosexuels comparativement aux hétérosexuels sans attirance envers le même sexe.
IC 95 % = 2,26 à 6,97
Nous pouvons être confiants à 95 % que le rapport de cote réel pour cette population ciblée se situe entre 2,26 à 6,97.
p < ,001
Puisque p < 0,001, il y a moins d’une chance sur 1 000 que ce lien ne soit pas réel pour cette population ciblée.
RC = 8,13
Les probabilités d’avoir une idée suicidaire sont 8 fois plus élevées pour les non-hétérosexuels victimes de harcèlement que pour les hétérosexuels sans attirance envers le même sexe et qui n’ont pas été victimes de harcèlement.
IC 95 % = 4,68 à 14,15
Nous pouvons être confiants à 95 % que le rapport de cote réel pour cette population ciblée se situe entre 4,68 et 14,15.
p < ,001
Puisque p < 0,001, il y a moins d’une chance sur 1 000 que ce lien ne soit pas réel pour cette population ciblée.
Les coefficients de corrélations sont souvent présentés sous la forme d’un tableau de corrélations dans les écrits.
Bégin, Boucher, St-Laurent, Heppell et Ratté (2016) ont cherché à mieux comprendre les liens qui unissent l’estime de soi, l’estime corporelle et les attitudes alimentaires par rapport à différentes atteintes à la santé mentale, notamment les troubles des conduites alimentaires et les troubles anxieux.
Notes :
Voici le tableau 2 de la section résultat qui résume quelques-uns de ces liens. Visionnez cette animation pour connaître quelques éléments clés pour vous guider.
Échelles |
Estime de soi explicite |
Estime de soi implicite |
Restriction alimentaire |
Préoccupation alimentaire |
Préoccupation poids |
Préoccupation silhouette |
Insatisfaction apparence |
Insatisfaction poids |
Estime de soi explicite |
1 |
0.03 |
-0.35** |
-0.40** |
-0.48** |
-0.56** |
0.75** |
0.55** |
Estime de soi implicite |
|
1 |
-0.25 |
-0.10 |
-0.24 |
-0.26 |
0.09 |
0.24 |
Restriction alimentaire |
|
|
1 |
0.57** |
0.48** |
0.51** |
-0.48** |
-0.48** |
Préoccupation alimentaire |
|
|
|
1 |
0.47** |
0.52** |
-0.47** |
-0.35** |
Préoccupation poids |
|
|
|
|
1 |
0.86** |
-0.63** |
-0.73** |
Préoccupation silhouette |
|
|
|
|
|
1 |
-0.69** |
-0.73** |
Insatisfaction apparence |
|
|
|
|
|
|
1 |
0.79** |
Insatisfaction poids |
|
|
|
|
|
|
|
1 |
Note : L’estime de soi explicite est mesurée par le ÉES-10; l’Estime de soi implicite par l’IAT; les attitudes alimentaires dysfonctionnelles sont mesurés par l’EDE-Q4 et l’insatisfaction corporelle est mesurée par l’EEC. |
1. Quelles sont les deux variables qui ont la relation positive la plus forte?
La préoccupation envers le poids et la préoccupation envers la silhouette sont les plus fortement corrélées positivement avec r = 0,86.
1.1. Pouvez-vous en faire l’interprétation?
Plus les participants sont préoccupés par le poids, plus ils sont également préoccupés par la silhouette. Cette relation est d’ailleurs forte avec r = 0,86.
2. Quelles sont les deux variables qui ont la relation négative la plus forte?
L’insatisfaction envers le poids est fortement corrélée négativement avec la préoccupation envers le poids (r = -0,73) et envers la silhouette (r = -0,73).
2.1. Pouvez-vous en faire l’interprétation?
Moins les participants sont satisfaits de leur poids, plus ils sont préoccupés par leur poids et leur silhouette. Ces deux relations sont d’ailleurs fortes avec r = -0,73.
3. Quelles sont les deux variables qui ont la relation la plus faible?
L’estime de soi explicite et implicite ont la corrélation la plus faible (r = 0,03).
3.1. Pouvez-vous en faire l’interprétation?
Puisque le coefficient de corrélation est très près de 0 (r = 0,03), il n’y a pratiquement aucun lien entre l’estime de soi explicite et implicite.
4. Quelle variable n’a aucune relation statistique significative avec l’ensemble des variables?
L’estime de soi implicite n’est corrélée de façon statiquement significative avec aucune autre variable. Ceci est visible par l’absence d’astérisque (*) pour chacune des corrélations où l’estime de soi implicite est impliquée. D’ailleurs, tous les coefficients de corrélations associés à l’estime de soi sont faibles ou quasi-nuls avec des r variant entre -0,26 et 0,24.
Les comparaisons des moyennes sont très fréquentes dans les écrits scientifiques.
Aimé, Cyr, Ricard, Guèvremont et Bournival (2016) ont cherché à préciser les liens entre l’alexithymie, les comportements alimentaires problématiques et la psychopathologie chez les femmes.
Qu’est-ce que l’alexithymie?
L’alexithymie est un trait de personnalité caractérisé par une difficulté à identifier, différencier et exprimer ses émotions.
Notes :
Voici le tableau 1 de la section résultat qui résume quelques-uns des liens entre l’alexithymie et quelques symptômes alimentaires ou facteurs psychologiques.
Caractéristiques |
Alexithymie (n = 92) |
Non-alexithymie (n = 42) |
F |
p |
Indice de masse corporelle |
27,68 ± 7,69 |
30,96 ± 8,45 |
4,48 |
.036 |
Symptomatologie alimentaire |
|
|
|
|
Restrictions |
2,73 ± 1,80 |
1,81 ± 1,53 |
9,27 |
.003 |
Préoccupations par rapport au poids |
3,72 ± 1,23 |
4,28 ± 1,49 |
5,3 |
.023 |
Préoccupations par rapport à la silhouette |
4,70 ± 1,27 |
4,22 ± 1,26 |
4,11 |
.045 |
Score total au EAT-26 |
27,83 ± 14, 93 |
21,67 ± 11, 89 |
6,56 |
.012 |
Facteurs psychologiques |
|
|
|
|
Estime de soi |
25,19 ± 5, 90 |
30,89 ± 5, 75 |
27,92 |
.000 |
Préoccupations face aux erreurs |
32,17 ± 7, 35 |
26,72 ± 8, 18 |
13,61 |
.000 |
Symptômes dépressifs |
27,14 ± 11, 39 |
16,40 ± 9, 77 |
31,34 |
.000 |
En observant le tableau, pouvez-vous discerner :
1. Où se situe la variable nominale?
Les deux colonnes « Alexithymie » et « Non-alexithymie » forment la variable « Alexithymie ». Il s’agit de la variable indépendante.
2. Où se situent les variables cardinales?
Elles sont toutes des variables cardinales, car les résultats sont exprimés sous la forme de moyenne ± écart-type.
3. Que signifient les colonnes F et p?
Colonne F : Il s’agit du test statistique employé pour comparer les moyennes entre les groupes alexithymie et non-alexithymie. La valeur de p est obtenue à partir du résultat du test de F. Vous n’avez pas à interpréter la valeur de F. Seul le p est important.
Colonne p : C’est la valeur qui vous permet de savoir si les différences observées sont représentatives pour la population ciblée. Souvenez-vous que si p < 0,05, vous avez moins de 5 % de chance de vous tromper en affirmant qu’il y a une différence entre les deux groupes.
1. Un indice de masse corporelle (IMC) plus élevé
2. Un niveau de restrictions plus élevé
3. Une préoccupation accrue par rapport à leur poids
4. Une préoccupation accrue par rapport à leur silhouette
5. Une estime de soi plus élevée
6. Une préoccupation accrue face aux erreurs
7. Un niveau de symptômes dépressifs plus élevé
Nous avons vu à l’unité 2 (étape 3) que la signification statistique démontre que les résultats ne sont probablement pas dus au hasard.
La signification clinique, quant à elle, suppose que les résultats doivent être utiles et applicables à la pratique.
Nous venons de voir que les statistiques de déduction nous permettent d’être confiant (en général à 95 %) que les résultats observés ne sont pas dus au hasard et qu’ils seraient bien réels non seulement dans notre échantillon, mais aussi dans un autre échantillon tiré de la même population cible.
Voici les concepts clés qui sont importants à retenir pour une meilleure compréhension des résultats statistiques.
Les résultats statistiques nous communiquent normalement trois éléments :
À la lecture des résultats quantitatifs d’une étude scientifique, tentez de discerner :
Même si un résultat s’avère statistiquement significatif, prenez la peine de retourner voir les statistiques de description ou de relation pour déterminer si les résultats observés sont applicables cliniquement.
Avec ces quelques concepts clés, vous voilà mieux outillé pour développer votre sens critique à la lecture des résultats quantitatifs!
Nous espérons que vous avez répondu positivement à cette question et que vous sentez que vous êtes plus apte à intégrer la pratique fondée sur les données probantes. Si certaines questions demeurent en suspens, nous vous invitons à communiquer avec la personne-ressource de l’atelier.
Vous pouvez également survoler l’onglet Ressources qui comprend plusieurs documents que vous pourrez trouver utile de conserver.
Vous pouvez maintenant passer à l’évaluation de l’atelier. Après cette évaluation, vous pourrez faire l’examen final si vous souhaitez recevoir une attestation pour cet atelier.