Code de contenu
m1377
Slug (identifiant)
le-coefficient-de-correlation-lineaire
Niveaux
Secondaire 4
Matière
Mathématiques
Tags
corrélation linéaire
coefficient de corrélation
Corrélation
régression linéaire
droite de régression
coefficient
nuage de points
tableau à double entrée
calcul du coefficient
coefficient de corrélation linéaire
formule du coefficient de corrélation
Contenu
Contenu
Corps

Une des utilités du nuage de points est de pouvoir estimer les résultats à venir. Afin de quantifier la justesse de cette estimation, on calcule le coefficient de corrélation linéaire.

Liens
Contenu
Corps

​Le coefficient de corrélation linéaire​, généralement noté |r|, quantifie la force du lien linéaire entre les deux caractères d’une distribution. Pour le déterminer, on peut procéder par estimation de son allure graphique ou utiliser une formule mathématique.

Le coefficient de corrélation aura toujours une valeur qui se situe dans l'intervalle [-1, 1]. 

Corps

Le coefficient de corrélation linéaire d'une distribution peut donner une idée de l'allure qu'a le nuage de points et inversement. D'abord, le signe du coefficient, positif ou négatif, indique le sens de la pente de la droite de régression. Pour bien comprendre le coefficient de corrélation, voici trois nuages de points qui illustrent bien ces valeurs extrêmes, soit -1, 0 et 1.

Nombre de colonnes
3 colonnes
Format
33% / 33% / 33%
Première colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est parfaite et négative.
Deuxième colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est nulle.
Troisième colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est parfaite et positive.
Corps

En d'autres mots, plus la valeur du coefficient de corrélation linéaire est près de 1 ou -1, plus le lien linéaire entre les deux variables est fort.

À l'inverse, plus sa valeur est près de 0, plus le lien linéaire entre les deux variables est faible.

Titre (niveau 2)
L'appréciation qualitative selon un nuage de points
Slug (identifiant) du title
appreciation-qualitative-nuage-de-points
Contenu
Corps

Pour calculer les valeurs de |r|, on peut utiliser un graphique ou faire des calculs arithmétiques. Par contre, si on veut seulement les comparer, on peut simplement jeter un coup d'œil aux nuages de points et à l'alignement des points de ceux-ci.

Contenu
Nombre de colonnes
2 colonnes
Format
50% / 50%
Première colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est forte et positive.
Deuxième colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est moyenne et positive.
Corps

En regardant attentivement ces graphiques, on voit que les points sont plus dispersés dans le deuxième nuage. Ainsi, on peut affirmer que le coefficient de corrélation linéaire est plus faible dans ce nuage que dans le premier.

Afin de bien voir la différence entre chacun des qualificatifs de corrélation, voici des nuages de points qui les représentent.

Corps

Corrélations linéaires négatives

Nombre de colonnes
3 colonnes
Format
33% / 33% / 33%
Première colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est négative et forte.
Deuxième colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est négative et moyenne.
Troisième colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est négative et faible.
Corps

Corrélations linéaires positives

Nombre de colonnes
3 colonnes
Format
33% / 33% / 33%
Première colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est positive et forte.
Deuxième colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est positive et moyenne.
Troisième colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est positive et faible.
Corps

Selon le qualificatif, on voit que le nuage est de plus en plus dispersé. Par contre, il est toujours possible de noter le sens du nuage (positif ou négatif). Lorsque les points sont tellement dispersés qu'il devient impossible d'en déterminer le sens, c'est souvent que le coefficient de corrélation linéaire est nul.

Titre (niveau 2)
L'appréciation qualitative selon un tableau à double entrée
Slug (identifiant) du title
appreciation-qualitative-tableau
Contenu
Corps

Afin de simplifier la représentation des données amassées, ces dernières sont parfois regroupées en classes et placées dans un tableau à double entrée. 

Contenu
Corps

Pour passer d'un nuage de points à un tableau à double entrée, on peut segmenter le nuage afin de bien définir chacune des classes.

Nombre de colonnes
2 colonnes
Format
50% / 50%
Première colonne
Corps

Ainsi, ce nuage de points...

Image
Cette image représente un nuage de points dont la corrélation est positive et forte.
Deuxième colonne
Corps

... devient ce tableau à double entrée :

Image
Cette image présente un tableau à double entrée dont la corrélation est positive et forte, car les données sont regroupées près de la diagonale.
Corps

Une fois ce tableau obtenu, il est possible d'estimer la corrélation des données.

Contenu
Nombre de colonnes
2 colonnes
Format
50% / 50%
Première colonne
Corps

Selon le tableau à double entrée précédent, on peut déduire que la corrélation est forte et positive.

Elle est positive, car plus les données augmentent en |X|, plus elles augmentent en |Y|.

Elle est forte, car les données sont regroupées près de la diagonale du tableau à double entrée.

Deuxième colonne
Image
Cette image présente un tableau à double entrée dont la corrélation est positive et forte, car les données sont regroupées près de la diagonale.
Corps

Fait à noter, si les données se situent autour de l'autre diagonale, soit celle qui commence en bas à gauche pour se terminer en haut à droite, la corrélation sera alors négative. 

Titre (niveau 2)
Le calcul du coefficient de corrélation linéaire
Slug (identifiant) du title
calcul-du-coefficient-correlation-lineaire
Contenu
Liens
Corps

​En déterminant de façon plus précise la valeur du coefficient de corrélation linéaire, on peut plus facilement qualifier la corrélation entre deux variables.

Contenu
Corps

||r\approx\pm\left(1-\dfrac{l}{L}\right)||

|L :| longueur du rectangle regroupant le nuage de points
|l :| largeur du rectangle regroupant le nuage de points

Pour ce qui est du signe de |r|, il sera déterminé selon le sens du nuage de points.

Corps

​De façon générale, cette formule permet de trouver une valeur assez représentative du coefficient de corrélation linéaire. Par contre, il existe des outils plus perfectionnés qui calculent intégralement cette valeur.

Généralement, les valeurs suivantes seront utilisées pour qualifier la corrélation linéaire :

​Valeur de |r| Force du lien linéaire

Près de 0

Nulle

Près de |\pm\, 0{,}50|

Faible

Près de |\pm\, 0{,}75|

Moyenne

Près de |\pm\, 0{,}87|

Forte

Près de |\pm\, 1|

Très forte

|\pm\, 1|

Parfaite

 

Titre (niveau 3)
​Le calcul du coefficient de corrélation linéaire à partir d'un graphique
Slug (identifiant) du title
calcul-du-coefficient-graphique
Corps

Afin d'associer une valeur numérique au coefficient de corrélation, on doit suivre 3 étapes.

Contenu
Corps
  1. Tracer le nuage de points.

  2. Tracer un rectangle et mesurer sa longueur et sa largeur.

  3. Calculer le coefficient de corrélation à l'aide de la formule.

Contenu
Nombre de colonnes
2 colonnes
Format
50% / 50%
Première colonne
Corps
  1. Tracer le nuage de points

    En plaçant chacun des couples dans un plan cartésien, on obtient le nuage de points suivant.

Deuxième colonne
Image
Ce graphique présente un nuage de points dont la corrélation linéaire est positive et moyenne.
Nombre de colonnes
2 colonnes
Format
50% / 50%
Première colonne
Corps
  1. Tracer un rectangle et mesurer sa longueur et sa largeur

    Le rectangle doit contenir tous les points et être le plus petit possible. Lorsqu'il est tracé, il suffit de prendre une règle graduée et de mesurer les segments.

    Puisqu'il n'y a aucune donnée aberrante ou éloignée, on obtient le rectangle suivant.

Deuxième colonne
Image
Le graphique présente un nuage de points dont la corrélation est positive et qui est entouré d'un rectangle.
Nombre de colonnes
2 colonnes
Format
50% / 50%
Première colonne
Corps
  1. Calculer le coefficient de corrélation à l'aide de la formule

Deuxième colonne
Corps

|r \approx \pm \left(1 - \dfrac{2{,}4}{6{,}2} \right)|
|r \approx \pm 0{,}61|
|r \approx 0{,}61|, car le nuage de points est de sens positif.

Titre (niveau 3)
Le calcul du coefficient de corrélation linéaire à l'aide des outils technologiques
Slug (identifiant) du title
calcul-du-coefficient-methode-algebrique
Corps

Avec des ​calculatrices à affichage graphique ou des logiciels comme des tableurs, on peut obtenir un coefficient de corrélation beaucoup plus précis. Il suffit d'entrer l'ensemble des données dans une table de valeurs, de sélectionner la bonne fonction et de laisser le logiciel faire les calculs. 

Contenu
Corps

La formule permettant de calculer précisément le coefficient de corrélation linéaire |r| est la suivante. ||r=\dfrac{\sum\left(x-\overline{x}\right)\left(y-\overline{y}\right)}{\sqrt{\sum\left(x-\overline{x}\right)^{2}}\sqrt{\sum\left(y-\overline{y}\right)^{2}}}||



|x :| une valeur de la 1re distribution
|\overline{x} :| la moyenne de la 1re distribution
|y :| une valeur de la 2e distribution
|\overline{y} :| la moyenne de la 2e distribution
|\sum :| symbole qui signifie la somme de…

Titre (niveau 2)
À voir aussi
Slug (identifiant) du title
a-voir-aussi
Contenu
Liens
Retirer la lecture audio
Non
Outil imprimable
Off