Pour analyser la dispersion des données d'une distribution, on peut séparer les données en |4| sous-groupes égaux nommés quarts. Ces quarts sont délimités par des quartiles.
-
Dans une distribution de données placées en ordre croissant, les quarts correspondent à |4| sous-groupes de la distribution qui contiennent le même nombre de données.
-
Dans une distribution de données placées en ordre croissant, les quartiles correspondent aux |3| valeurs qui séparent la distribution en |4| quarts égaux.
-
Le 1er quartile, noté |\boldsymbol{Q_1},| est la valeur qui sépare le premier quart du reste de la distribution.
-
Le 2e quartile, noté |\boldsymbol{Q_2},| est la valeur qui sépare la distribution en |2| parties égales. Autrement dit, il s'agit de la médiane.
-
Le 3e quartile, noté |\boldsymbol{Q_3},| est la valeur qui sépare le dernier quart du reste de la distribution.
Chaque quart contient environ |25\ \%| des données de la distribution. Ainsi, |25\ \%| des données sont inférieures au 1er quartile, |50\ \%| des données sont inférieures au 2e quartile et |75\ \%| des données sont inférieures au 3e quartile.
Voici la démarche à suivre pour déterminer les quartiles d’une distribution de données.
-
Placer les données en ordre croissant.
-
Séparer la distribution de données en |4| quarts égaux.
-
Déterminer la valeur des quartiles.
Les quartiles ne sont pas nécessairement des valeurs qui font partie de la distribution. En effet, cela dépend du nombre total de données. Il y a |2| cas différents lorsque le nombre de données est pair et |2| cas différents lorsque le nombre de données est impair.
Nombre de données pair
||\begin{alignat}{20}&&&\!\!\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2}}}\\1\ &\color{#3b87cd}{\Big\vert}\ 2\ &&\color{#ec0000}{\Big\vert}\ 3\ &&\color{#7cca51}{\Big\vert}\ 4\\&\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1}}}&&&&\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3}}}\end{alignat}||Dans ce cas, les |3| quartiles ne sont pas des données de la distribution.
||\begin{alignat}{20}&&&\!\!\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2}}}\\1\ &\color{#3b87cd}{\boxed{\boldsymbol{2}}}\ 3\ &&\color{#ec0000}{\Big\vert}\ 4\ &&\color{#7cca51}{\boxed{\boldsymbol{5}}}\ 6\\&\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1}}}&&&&\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3}}}\end{alignat}||Dans ce cas, |Q_2| n’est pas une donnée de la distribution, alors que |Q_1| et |Q_3| sont des données de la distribution.
Nombre de données impair
||\begin{alignat}{20}&&&\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2}}}\\1\ &\color{#3b87cd}{\Big\vert}\ 2\ &&\color{#ec0000}{\boxed{\boldsymbol{3}}}\ 4\ &&\color{#7cca51}{\Big\vert}\ 5\\&\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1}}}&&&&\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3}}}\end{alignat}||Dans ce cas, |Q_2| est une donnée de la distribution, alors que |Q_1| et |Q_3| ne sont pas des données de la distribution.
||\begin{alignat}{20}&&&\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2}}}\\1\ &\color{#3b87cd}{\boxed{\boldsymbol{2}}}\ 3\ &&\color{#ec0000}{\boxed{\boldsymbol{4}}}\ 5\ &&\color{#7cca51}{\boxed{\boldsymbol{6}}}\ 7\\&\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1}}}&&&&\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3}}}\end{alignat}||Dans ce cas, les |3| quartiles sont des données de la distribution.
Il faut déterminer la valeur de la médiane |(Q_2)| avant de déterminer celle de |Q_1| et celle de |Q_3.|
Voici un exemple où le nombre total de données est impair.
Détermine la valeur des |3| quartiles de la distribution suivante.
|4,| |9,| |2,| |5,| |10,| |2,| |7,| |6,| |9,| |1,| |3,| |5,| |6|
-
Placer les données en ordre croissant
|1,| |2,| |2,| |3,| |4,| |5,| |5,| |6,| |6,| |7,| |9,| |9,| |10|
-
Séparer la distribution de données en |\boldsymbol{4}| quarts égaux
Cette distribution est constituée d’un nombre impair de données |(13).| Ainsi, |Q_2| est la donnée au centre de la distribution et la sépare en |2| sous-groupes de |6| données. |Q_1| et |Q_3| sont donc entre des données, de façon à créer |4| quarts qui contiennent |3| données chacun.||\begin{alignat}{20}&&&\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2}}}\\1,2,2\ &\color{#3b87cd}{\Big\vert}\ 3,4,5\ &&\color{#ec0000}{\boxed{\boldsymbol{5}}}\ 6,6,7\ &&\color{#7cca51}{\Big\vert}\ 9,9,10\\&\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1}}}&&&&\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3}}}\end{alignat}||
-
Déterminer la valeur des quartiles
On commence par déterminer la valeur de la médiane |(Q_2),| qui correspond à la 7e donnée.||\boldsymbol{\color{#ec0000}{Q_2}}=\boldsymbol{\color{#ec0000}{5}}||Ensuite, on calcule le 1er quartile |(Q_1),| qui correspond à la moyenne des 3e et 4e données.||\begin{alignat}{20}1,2,\boldsymbol{2}\ &\color{#3b87cd}{\Big\vert}\ \boldsymbol{3},4,5\ \color{#ec0000}{\boxed{\boldsymbol{5}}}\ 6,6,7\ \color{#7cca51}{\Big\vert}\ 9,9,10\\&\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1}}}\end{alignat}||||\boldsymbol{\color{#3b87cd}{Q_1}}=\dfrac{2+3}{2}=\boldsymbol{\color{#3b87cd}{2{,}5}}||Finalement, on calcule le 3e quartile |(Q_3),| qui correspond à la moyenne des 10e et 11e données.||\begin{alignat}{20}1,2,2\ \color{#3b87cd}{\Big\vert}\ 3,4,5\ \color{#ec0000}{\boxed{\boldsymbol{5}}}\ 6,6,\boldsymbol{7}\ &&&&&\color{#7cca51}{\Big\vert}\ \boldsymbol{9},9,10\\&&&&&\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3}}}\end{alignat}||||\boldsymbol{\color{#7cca51}{Q_3}}=\dfrac{7+9}{2}=\boldsymbol{\color{#7cca51}{8}}||Réponse : Le 1er quartile de la distribution est |2{,}5,| le 2e quartile est |5| et le 3e quartile est |8.|||\begin{alignat}{20}&&&\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#ec0000}{\underbrace{\phantom{|}Q_2=5\phantom{|}}}}\\1,2,2\ &\color{#3b87cd}{\Big\vert}\ 3,4,5\ &&\color{#ec0000}{\boxed{\boldsymbol{5}}}\ 6,6,7\ &&\color{#7cca51}{\Big\vert}\ 9,9,10\\&\!\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1=2{,}5}}}&&&&\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{\phantom{|}Q_3=8\phantom{|}}}}\end{alignat}||
Voici un exemple où le nombre total de données est pair.
Détermine la valeur des |3| quartiles de la distribution suivante.
|60,| |32,| |87,| |98,| |56,| |75,| |35,| |68,| |86,| |90,| |75,| |59,| |61,| |84,| |64,| |48|
-
Placer les données en ordre croissant
|32,| |35,| |48,| |56,| |59,| |60,| |61,| |64,| |68,| |75,| |75,| |84,| |86,| |87,| |90,| |98|
-
Séparer la distribution de données en |\boldsymbol{4}| quarts égaux
Cette distribution est constituée d’un nombre pair de données |(16).| Ainsi, |Q_2| est entre les |2| données au centre de la distribution et la sépare en |2| sous-groupes de |8| données. |Q_1| et |Q_3| sont donc entre des données, de façon à créer |4| quarts qui contiennent |4| données.||\begin{alignat}{20}&&&\!\!\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2}}}\\32,35,48,56\ &\color{#3b87cd}{\Big\vert}\ 59,60,61,64\ &&\color{#ec0000}{\Big\vert}\ 68,75,75,84\ &&\color{#7cca51}{\Big\vert}\ 86,87,90,98\\&\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1}}}&&&&\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3}}}\end{alignat}||
-
Déterminer la valeur des quartiles
On commence par déterminer la valeur de la médiane |(Q_2),| qui correspond à la moyenne des 8e et 9e données.||\begin{alignat}{20}&\!\!\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2}}}\\32,35,48,56\ \color{#3b87cd}{\Big\vert}\ 59,60,61,\boldsymbol{64}\ &\color{#ec0000}{\Big\vert}\ \boldsymbol{68},75,75,84\ \color{#7cca51}{\Big\vert}\ 86,87,90,98\\\phantom{\boldsymbol{\overbrace{Q_1}}}\end{alignat}||||\boldsymbol{\color{#ec0000}{Q_2}}=\dfrac{64+68}{2}=\boldsymbol{\color{#ec0000}{66}}||Ensuite, on calcule le 1er quartile |(Q_1),| qui correspond à la moyenne des 4e et 5e données.||\begin{alignat}{20}32,35,48,\boldsymbol{56}\ &\color{#3b87cd}{\Big\vert}\ \boldsymbol{59},60,61,64\ \color{#ec0000}{\Big\vert}\ 68,75,75,84\ \color{#7cca51}{\Big\vert}\ 86,87,90,98\\&\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1}}}\end{alignat}||||\boldsymbol{\color{#3b87cd}{Q_1}}=\dfrac{56+59}{2}=\boldsymbol{\color{#3b87cd}{57{,}5}}||Finalement, on calcule le 3e quartile |(Q_3),| qui correspond à la moyenne des 12e et 13e données.||\begin{alignat}{20}32,35,48,56\ \color{#3b87cd}{\Big\vert}\ 59,60,61,64\ \color{#ec0000}{\Big\vert}\ 68,75,75,\boldsymbol{84}\ &&&&&\color{#7cca51}{\Big\vert}\ \boldsymbol{86},87,90,98\\&&&&&\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3}}}\end{alignat}||||\boldsymbol{\color{#7cca51}{Q_3}}=\dfrac{84+86}{2}=\boldsymbol{\color{#7cca51}{85}}||Réponse : Le 1er quartile de la distribution est |57{,}5,| le 2e quartile est |66| et le 3e quartile est |85.|||\begin{alignat}{20}&&&\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2=66}}}\\32,35,48,56\ &\color{#3b87cd}{\Big\vert}\ 59,60,61,64\ &&\color{#ec0000}{\Big\vert}\ 68,75,75,84\ &&\color{#7cca51}{\Big\vert}\ 86,87,90,98\\&\!\!\!\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1=57{,}5}}}&&&&\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3=85}}}\end{alignat}||
Il est possible de convertir des quartiles en centiles et vice versa.
Après avoir déterminé la valeur des quartiles, il est possible d’analyser la dispersion des données dans une distribution. Pour ce faire, on peut utiliser l’étendue interquartile.
L’étendue interquartile, notée |\boldsymbol{EI},| correspond à l’étendue entre le 1er quartile |(Q_1)| et le 3e quartile |(Q_3).|
L’étendue interquartile représente la dispersion des quarts de part et d’autre de la médiane |(Q_2).| Autrement dit, elle donne une idée de la concentration de |50\ \%| des données du centre de la distribution. Dans un diagramme de quartiles, l’étendue interquartile correspond à la largeur de la boite du diagramme.
Pour obtenir la valeur de cette étendue, on effectue le calcul suivant.
||EI=Q_3-Q_1||
où
|EI:| étendue interquartile
|Q_1:| valeur du 1er quartile
|Q_3:| valeur du 3e quartile
Détermine l’étendue interquartile de la distribution suivante.||\begin{alignat}{20}&&&\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2=66}}}\\32,35,48,56\ &\color{#3b87cd}{\Big\vert}\ 59,60,61,64\ &&\color{#ec0000}{\Big\vert}\ 68,75,75,84\ &&\color{#7cca51}{\Big\vert}\ 86,87,90,98\\&\!\!\!\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1=57{,}5}}}&&&&\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3=85}}}\end{alignat}||
Selon la formule, on effectue le calcul suivant.||\begin{align}EI&=Q_3-Q_1\\&=85-57{,}5\\&=27{,}5\end{align}||Autrement dit, |50\ \%| des données qui sont autour de la médiane |(Q_2)| sont regroupées à l’intérieur d’un intervalle de |27{,}5| unités.
Après avoir déterminé la valeur des quartiles, du minimum et du maximum, il est possible d’analyser la dispersion des données dans chacun des quarts d’une distribution. Pour ce faire, on peut utiliser l’étendue des quarts.
L’étendue d’un quart, notée |\boldsymbol{EQ},| correspond à l’étendue entre les valeurs aux extrémités d’un quart d’une distribution de données.
L’étendue des quarts donne une idée de la concentration de chaque tranche de |25\ \%| des données de la distribution.
Pour obtenir la valeur de l’étendue des quarts, on effectue les calculs suivants.
||\begin{align}EQ_1&=Q_1-x_\text{min}\\EQ_2&=Q_2-Q_1\\EQ_3&=Q_3-Q_2\\EQ_4&=x_\text{max}-Q_3\end{align}||
où
|EQ:| étendue d’un quart
|x_\text{min}:| valeur minimale de la distribution
|Q_1:| valeur du 1er quartile
|Q_2:| valeur du 2e quartile
|Q_3:| valeur du 3e quartile
|x_\text{max}:| valeur maximale de la distribution
Il faut analyser la distribution pour détecter s’il y a des données éloignées (aberrantes) avant de déterminer |x_\text{min}| et |x_\text{max}.|
Déterminer l’étendue des quarts de la distribution suivante.||\begin{alignat}{20}&&&\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#ec0000}{\underbrace{Q_2=66}}}\\32,35,48,56\ &\color{#3b87cd}{\Big\vert}\ 59,60,61,64\ &&\color{#ec0000}{\Big\vert}\ 68,75,75,84\ &&\color{#7cca51}{\Big\vert}\ 86,87,90,98\\&\!\!\!\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#3b87cd}{\overbrace{Q_1=57{,}5}}}&&&&\!\!\!\!\!\!\!\!\!\!\!\boldsymbol{\color{#7cca51}{\overbrace{Q_3=85}}}\end{alignat}||
Selon les formules, on effectue les calculs suivants.||\begin{align}EQ_1&=Q_1-x_\text{min}\\&=57{,}5-32\\&=25{,}5\\\\EQ_2&=Q_2-Q_1\\&=66-57{,}5\\&=8{,}5\\\\EQ_3&=Q_3-Q_2\\&=85-66\\&=19\\\\EQ_4&=x_\text{max}-Q_3\\&=98-85\\&=13\end{align}||Ainsi, on peut déterminer que le 2e quart contient les données les plus concentrées |(EQ_2=8{,}5)| et que le 1er quart contient les données les plus dispersées |(EQ_1=25{,}5).|