Code de contenu
m1507
Slug (identifiant)
la-droite-de-mayer
Contenu parent
Niveaux
Secondaire 4
Matière
Mathématiques
Tags
droite de régression
corrélation linéaire
nuage de points
interpolation
extrapoler
Contenu
Contenu
Corps

La méthode de la droite de Mayer est une méthode permettant de tracer une droite de régression pour un nuage de points donné en calculant des moyennes. Cette droite peut être utilisée pour interpoler ou extrapoler des valeurs, c’est-à-dire pour faire des prédictions.

Voici les étapes à suivre pour trouver la règle de la droite de Mayer et pour faire des prédictions à partir d’un ensemble de données à 2 caractères.

Contenu
Corps
  1. Ordonner les coordonnées selon la variable indépendante.

  2. Séparer la distribution en 2 groupes égaux, si possible.

  3. Calculer les points moyens de chaque groupe |(P_1| et |P_2).|

  4. Trouver la règle de la droite de régression passant par les points |P_1| et |P_2.|

  5. Prédire des valeurs à l’aide de la règle de la droite.

Contenu
Corps

À la suite d’une enquête réalisée auprès de |16| familles québécoises, on s'est intéressé aux dépenses totales liées aux sports et aux loisirs en fonction de leur revenu familial.

La table de valeurs ci-dessous présente les données recueillies. Ces données ont ensuite été placées dans un plan cartésien pour former un nuage de points.

Corps
Les dépenses liées aux sports et aux loisirs en fonction du revenu familial
Revenu familial
($/année)
|125\ 000| |65\ 000| |35\ 000| |145\ 000| |130\ 000| |80\ 000| |50\ 000| |40\ 000|
Dépenses liées aux sports et aux loisirs
($/année)
|10\ 000| |8\ 000| |1\ 000| |9\ 000| |8\ 000| |6\ 000| |4\ 000| |2\ 000|
Revenu familial
($/année)
|90\ 000| |20\ 000| |75\ 000| |105\ 000| |100\ 000| |140\ 000| |150\ 000| |65\ 000|
Dépenses liées aux sports et aux loisirs
($/année)
|10\ 000| |500| |4\ 000| |6\ 000| |8\ 000| |13\ 000| |5\ 000| |5\ 000|
Image
 Nuage de points représentant une corrélation positive.
Corps

a) Une famille a un revenu familial annuel de |250\ 000\ \$.| Si cette famille suit la même tendance que les autres familles québécoises interrogées, à quel montant son budget consacré aux sports et aux loisirs s'élève-t-il?

b) Une famille dépense en moyenne |7\ 500\ \$| par année pour les sports et les loisirs. À combien son revenu familial annuel s’élève-t-il si elle suit les habitudes d’une famille québécoise typique?


  1. Ordonner les coordonnées selon la variable indépendante

Corps
Les dépenses liées aux sports et aux loisirs en fonction du revenu familial
Revenu familial
($/année)
|20\ 000| |35\ 000| |40\ 000| |50\ 000| |65\ 000| |65\ 000| |75\ 000| |80\ 000|
Dépenses liées aux sports et aux loisirs
($/année)
|500| |1\ 000| |2\ 000| |4\ 000| |5\ 000| |8\ 000| |4\ 000| |6\ 000|
Revenu familial
($/année)
|90\ 000| |100\ 000| |105\ 000| |125\ 000| |130\ 000| |140\ 000| |145\ 000| |150\ 000|
Dépenses liées aux sports et aux loisirs
($/année)
|10\ 000| |8\ 000| |6\ 000| |10\ 000| |8\ 000| |13\ 000| |9\ 000| |5\ 000|
Corps
  1. Séparer la distribution en 2 groupes égaux

La distribution comprend |16| couples de données. Les |8| couples dont le revenu familial va de |20\ 000| à |80\ 000\ \$| par année constituent le 1er groupe. Les |8| autres couples forment le 2e groupe.

  1. Calculer les points moyens de chaque groupe |\boldsymbol{(P_1}| et |\boldsymbol{P_2)}|

Il suffit de trouver la moyenne en |x| et en |y| de chacun des groupes afin de former 2 points.

Corps
  Moyenne des abscisses |\boldsymbol{(\overline{x})}| Moyenne des ordonnées |\boldsymbol{(\overline{y})}| Point moyen
1er groupe |\begin{align}\overline{x}_1 &= \dfrac{\left(\begin{gathered}20\ 000+35\ 000+40\ 000+50\ 000\\+\,65\ 000+65\ 000+75\ 000+80\ 000\end{gathered}\right)}{8} \\ &= \dfrac{430\ 000}{8} \\ &=53\ 750 \end{align}| |\begin{align}\overline{y}_1 &= \dfrac{\left(\begin{gathered}500+1\ 000+2\ 000+4\ 000\\+\,5\ 000+8\ 000+4\ 000+6\ 000\end{gathered}\right)}{8} \\ &= \dfrac{30\ 500}{8} \\ &=3\ 812{,}5 \end{align}| |P_1(53\ 750; 3\ 812{,}5)|
2e groupe |\begin{align}\overline{x}_2 &= \dfrac{\left(\begin{gathered}90\ 000+100\ 000+105\ 000+125\ 000\\+\,130\ 000+140\ 000+145\ 000+150\ 000\end{gathered}\right)}{8} \\ &= \dfrac{985\ 000}{8} \\ &=123\ 125 \end{align}| |\begin{align}\overline{y}_2 &= \dfrac{\left(\begin{gathered}10\ 000+8\ 000+6\ 000+10\ 000\\+\,8\ 000+13\ 000+9\ 000+5\ 000\end{gathered}\right)}{8} \\ &= \dfrac{69\ 000}{8} \\ &=8\ 625 \end{align}| |P_2(123\ 125; 8\ 625)|
Corps
  1. Trouver la règle de la droite de régression passant par les points |\boldsymbol{P_1}| et |\boldsymbol{P_2}|

Comme il s’agit d’une droite, la règle est de la forme |y=ax+b.| On commence par calculer la pente |(a).| ||\begin{align}a&=\dfrac{\overline{y}_2-\overline{y}_1}{\overline{x}_2-\overline{x}_1}\\&=\dfrac{8\ 625-3\ 812{,}5}{123\ 125-53\ 750}\\&\approx 0{,}07\end{align}||Ensuite, on remplace |a| par |0{,}07| et les variables |x| et |y| par les coordonnées d’un des 2 points, puis on isole |b.| ||\begin{align} y &= ax+b \\ y &= 0{,}07x+b \\ 8\ 625 &= 0{,}07(123\ 125)+b \\ 8\ 625 &\approx 8\ 619+b \\ 6 &\approx b \end{align}||Ainsi, la règle de la droite de Mayer est |y=0{,}07x+6,| où |x| est le revenu familial et |y,| le budget consacré aux sports et aux loisirs, tous les 2 en |\$| par année. On peut tracer cette droite dans le graphique.

Image
Nuage de points représentant une corrélation positive avec une droite de régression.
Corps
  1. Prédire des valeurs à l’aide de la règle de la droite

a) Une famille a un revenu familial annuel de |\boldsymbol{250\ 000\ \$.}| Si cette famille suit la même tendance que les autres familles québécoises interrogées, à quel montant son budget consacré aux sports et aux loisirs s'élève-t-il?

On peut faire une estimation des dépenses de cette famille en sports et en loisirs à l’aide de la droite de régression. Il s’agit d’une extrapolation, car le revenu familial en question |(250\ 000\ \$)| est en dehors de l’intervalle étudié |(20\ 000| à |150\ 000\ \$).| 

On remplace la variable |x| par |250\ 000| dans la règle de la droite de régression et on complète le calcul. ||\begin{align}y&=0{,}07x+6\\y&=0{,}07(250\ 000)+6\\y&=17\ 500+6\\y&=17\ 506\ \$ \end{align}||Réponse : Si une famille ayant un revenu annuel de |250\ 000\ \$| suit la même tendance que les autres familles québécoises interrogées, elle devrait consacrer environ |17\ 506\ \$| aux sports et aux loisirs.
 

b) Une famille dépense en moyenne |\boldsymbol{7\ 500\ \$}| par année pour les sports et les loisirs. À combien son revenu familial annuel s’élève-t-il si elle suit les habitudes d’une famille québécoise typique?

On peut estimer le revenu annuel de cette famille à l’aide de la droite de régression. Il s’agit d’une interpolation, car le budget annuel consacré aux loisirs et aux sports |(7\ 500\ \$)| est à l’intérieur de l’intervalle étudié |(500| à |13\ 000\ \$).|

On remplace |y| par |7\ 500| et on isole |x.| ||\begin{align} y &= 0{,}07x+6 \\ 7\ 500 &= 0{,}07x+6 \\ 7\ 500\boldsymbol{\color{#ec0000}{-6}} &= 0{,}07x+6 \boldsymbol{\color{#ec0000}{-6}} \\ \dfrac{7\ 494}{\boldsymbol{\color{#ec0000}{0{,}07}}} &= \dfrac{0{,}07x}{\boldsymbol{\color{#ec0000}{0{,}07}}} \\ 107\ 057\ \$ &\approx x \end{align}||Réponse : Si une famille dépense en moyenne |7\ 500\ \$| par année pour les sports et les loisirs, on peut s’attendre à ce que son revenu familial annuel soit d’environ |107\ 057\ \$.|
 

Remarque : Le même problème a été résolu dans les fiches portant sur la droite de régression et sur la droite médiane-médiane. Chaque fois, on obtient des résultats comparables.

Contenu
Corps

Lorsqu’il faut ordonner les points

  • On ordonne les points selon leur abscisse. Il ne faut pas ordonner les abscisses et les ordonnées séparément.

  • Si 2 points ont le même abscisse, mais des ordonnées différentes, alors celui avec la plus petite ordonnée est placé en premier.

Exemple :

Nombre de colonnes
3 colonnes
Format
33% / 33% / 33%
Première colonne
Corps

Voici une table de valeurs.

|x| |13| |12| |13| |13| |10| |12|
|y| |35| |24| |35| |28| |25| |29|
Deuxième colonne
Corps

On obtient la table suivante.

|x| |10| |12| |12| |13| |13| |13|
|y| |25| |24| |29| |28| |35| |35|
Troisième colonne
Corps

On n’obtient pas celle-ci.

|x| |10| |12| |12| |13| |13| |13|
|y| |24| |25| |28| |29| |35| |35|
Corps

Lorsqu’il faut séparer les points en 2 groupes

  • Si le nombre de points se divise par 2, les groupes sont égaux.
    Par exemple, 16 = 8 + 8.

  • Si le nombre de points ne se divise pas par 2, on peut choisir d’ignorer le couple du milieu ou de l’inclure dans un des 2 groupes, au choix.
    Par exemple, 29 = 15 + 14 ou  14 + 15 ou 14 + 14 + une donnée qu’on laisse de côté.

Titre (niveau 2)
La comparaison des méthodes : Mayer vs médiane-médiane
Slug (identifiant) du title
comparaison
Contenu
Corps

La méthode de la droite de Mayer est généralement plus rapide à effectuer que celle de la droite médiane-médiane, mais il ne s’agit pas toujours de la meilleure méthode. Voici un exemple où on présente les 2 démarches en parallèle dans le but de les comparer.

Contenu
Corps

Lors d’une saison de hockey, les points marqués par tous les joueurs sont comptabilisés. Les points d’un joueur comprennent les passes décisives (assist en anglais) et les buts. Au hockey, on compte jusqu’à 2 passes décisives par but marqué, soit les 2 dernières passes effectuées juste avant le but.

Voici le nombre de passes décisives et de points de 10 attaquants réguliers des Bruins de Boston lors de la saison 2022-2023 de la LNH.

Joueur Nombre de passes Nombre de points
D. Pastrnak ||49|| ||109||
B. Marchand ||46|| ||66||
P. Zacha ||37|| ||58||
P. Bergeron ||30|| ||57||
D. Krejci ||40|| ||56||
J. DeBrusk ||23|| ||48||
C. Coyle ||29|| ||44||
T. Hall ||20|| ||36||
T. Frederic ||14|| ||30||
N. Foligno ||16|| ||28||

Si on se fie aux données de cette équipe, un joueur qui aurait fait |60| passes décisives aurait dû terminer la saison avec combien de points?

Solution
Corps
  1. Ordonner les coordonnées selon la variable indépendante

Corps
Nombre de passes |14| |16| |20| |23| |29| |30| |37| |40| |46| |49|
Nombre de points |30| |28| |36| |48| |44| |57| |58| |56| |66| |109|
Nombre de colonnes
2 colonnes
Format
50% / 50%
Première colonne
Corps

La droite de Mayer

  1. Séparer la distribution en 2 groupes égaux

Les |5| couples dont le nombre de passes est de |29| et moins constituent le 1er groupe. Les |5| autres couples forment le 2e groupe. 

  1. Calculer les points moyens de chaque groupe |\boldsymbol{(P_1}| et |\boldsymbol{P_2)}|

Corps
  Moyenne des abscisses |(\overline{x})| Moyenne des ordonnées |(\overline{y})| Point moyen
1er groupe |\begin{align}\overline{x}_1 &= \dfrac{14+16+20+23+29}{5} \\ &=20{,}4\end{align}| |\begin{align}\overline{y}_1 &= \dfrac{30+28+36+48+44}{5} \\ &=37{,}2\end{align}| |P_1(20{,}4; 37{,}2)|
2e groupe |\begin{align}\overline{x}_2 &= \dfrac{30+37+40+46+49}{5} \\ &=40{,}4\end{align}| |\begin{align}\overline{y}_2 &= \dfrac{57+58+56+66+109}{5} \\ &=69{,}2\end{align}| |P_2(40{,}4;69{,}2)|
Corps
  1. Trouver la règle de la droite de régression passant par les points |\boldsymbol{P_1}| et |\boldsymbol{P_2}|

Comme il s’agit d’une droite, la règle est de la forme |y=ax+b.| On commence par calculer la pente |(a).| ||\begin{align}a&=\dfrac{\overline{y}_2-\overline{y}_1}{\overline{x}_2-\overline{x}_1}\\&=\dfrac{69{,}2-37{,}2}{40{,}4-20{,}4}\\&= 1{,}6\end{align}||Ensuite, on remplace |a| par |1{,}6| et les variables |x| et |y| par les coordonnées d’un des 2 points, puis on isole |b.| ||\begin{align} y &= ax+b \\ y &= 1{,}6x+b \\ 37{,}2 &= 1{,}6(20{,}4)+b \\ 37{,}2 &= 32{,}64+b \\ 4{,}56 &= b \end{align}||Ainsi, la règle de la droite de régression trouvée à l’aide de la méthode de la droite de Mayer est |\color{#3b87cd}{y=1{,}6x+4{,}56},| où |x| est le nombre de passes décisives et |y,| le nombre de points.

  1. Prédire des valeurs à l’aide de la règle de la droite

Il s’agit d’une extrapolation, car le nombre de passes |(60)| est à l’extérieur de l’intervalle étudié |(14| à |49).| On estime donc le nombre de points à l’aide de la droite de Mayer en remplaçant |x| par |60.| ||\begin{align} y &= 1{,}6x+4{,}56 \\&= 1{,}6(60)+4{,}56 \\ &= 96+4{,}56\\&= 100{,}56\\ &\approx 101\ \text{points} \end{align}||

Deuxième colonne
Corps

La droite médiane-médiane

  1. Séparer la distribution en 3 groupes égaux

Les 1er et 3e groupes ont |3| couples de données chacun et le 2e en a |4.| 

  1. Calculer les points médians de chaque groupe |\boldsymbol{(M_1, M_2}| et |\boldsymbol{M_3)}|

Corps
  Médiane des abscisses |(x)| Médiane des ordonnées |(y)| Point médian
1er groupe |x_1=16| |y_1=30| |M_1(16,30)|
2e groupe |\begin{align}x_2&=\dfrac{29+30}{2}\\&=29{,}5\end{align}| |\begin{align}y_2&=\dfrac{48+57}{2}\\&=52{,}5\end{align}| |M_2(29{,}5;52{,}5)|
3e groupe |x_3=46| |y_3=66| |M_3(46,66)|
Corps
  1. Calculer le point moyen |\boldsymbol{P},| dont les coordonnées sont la moyenne des abscisses et la moyenne des ordonnées des points |\boldsymbol{M_1, M_2}| et |\boldsymbol{M_3}|

||\begin{align}P&\left(\dfrac{16+29{,}5+46}{3},\dfrac{30+52{,}5+66}{3}\right)\\ P&\ (\ 30{,}5;\ 49{,}5\ )\end{align}||

  1. Déterminer le taux de variation |\boldsymbol{(a)}| de la droite passant par |\boldsymbol{M_1}| et |\boldsymbol{M_3}| ||\begin{align}a&=\dfrac{y_3-y_1}{x_3-x_1}\\&=\dfrac{66-30}{46-16}\\&=1{,}2\end{align}||

  2. Déterminer l’ordonnée à l’origine |\boldsymbol{(b)}| de la droite passant par |\boldsymbol{P}| et dont le taux de variation est |\boldsymbol{a}| ||\begin{align} y &= ax+b \\ y &= 1{,}2x+b \\ 49{,}5 &= 1{,}2(30{,}5)+b \\ 49{,}5 &= 36{,}6+b \\ 12{,}9 &= b \end{align}||Ainsi, la règle de la droite médiane-médiane est |\color{#560fa5}{y=1{,}2x+12{,}9},| où |x| est le nombre de passes décisives et |y,| le nombre de points.

  3. Prédire des valeurs à l’aide de la règle de la droite

    On fait une extrapolation du nombre de points à l’aide de la droite médiane-médiane en remplaçant la variable |x| par |60.| ||\begin{align} y &= 1{,}2x+12{,}9 \\&= 1{,}2(60)+12{,}9 \\ &= 72+12{,}9 \\ &= 84{,}9\\ &\approx 85\ \text{points} \end{align}||

Corps

Réponse : Un joueur qui fait |60| passes décisives dans une saison devrait obtenir environ |85| points selon la droite de médiane-médiane ou |101| points selon la droite de Mayer.

Contenu
Corps

La méthode de Mayer se base sur le calcul de la moyenne. Or, la moyenne est une mesure de tendance centrale qui est très influencée par les données éloignées, aussi appelées données aberrantes. Au contraire, la méthode médiane-médiane n’est pas influencée par les données aberrantes.

Autrement dit, lorsqu’il y a une ou des données éloignées dans une distribution, les prédictions faites à l’aide de la droite de Mayer sont moins fiables, c’est-à-dire moins représentatives de l’ensemble des données que celles effectuées à l’aide de la droite médiane-médiane. C’est donc cette dernière méthode qu’il faut privilégier dans de telles situations.

Corps

En revenant sur l’exemple des points marqués par les joueurs des Bruins de Boston, on pourra déterminer quelle réponse est la plus fiable entre celle obtenue à l’aide de la droite de Mayer et celle obtenue à l’aide de la droite médiane-médiane.

On commence par tracer le nuage de points et les 2 droites dans le même graphique.

Nombre de colonnes
2 colonnes
Format
50% / 50%
Première colonne
Image
La droite de Mayer et la droite médiane-médiane passent au travers d’un nuage de points qui a une donnée éloignée.
Deuxième colonne
Corps

D’abord, on remarque que la pente des 2 droites est assez différente. Pour la droite médiane-médiane, le taux de variation est de |1{,}2,| alors que la droite de Mayer a une pente de |1{,}6.|

On remarque aussi que le point |(49,109),| qui représente les données de David Pastrnak, est éloigné des autres. Ce joueur a accumulé beaucoup plus de points au total par rapport à son nombre de passes décisives que le reste de son équipe |\left(\dfrac{109}{49} \approx 2{,}22\right).|

Les données de Pastrnak ont eu une influence sur la méthode de Mayer, car elles ont été incluses dans les calculs des points moyens. Cela a eu pour effet d’augmenter la valeur de la pente de la droite de Mayer par rapport à l’autre méthode. En effet, le point |(49,109),| même s’il est élevé, n’influence pas les points médians. C’est pourquoi la droite médiane-médiane est moins inclinée et s’ajuste mieux à l’ensemble des données, ce qu’on peut observer sur le graphique. Au contraire, la droite de Mayer est plus inclinée pour se rapprocher du point |(49,109).| Elle est donc moins ajustée au reste du nuage de points.

Conclusion : On considère donc que les prédictions faites à partir de la droite médiane-médiane sont plus représentatives de l’ensemble des joueurs. Ainsi, un joueur qui fait |60| passes décisives dans une saison devrait obtenir environ |85| points et non |101.|

Contenu
Titre
À voir aussi
Liens
Retirer la lecture audio
Non