Pour compiler et faire une bonne interprétation des données recueillies lors d'une enquête statistique, il est préférable d'utiliser des modes de représentations adéquats et concis tels des tableaux.
Lorsqu’on a une distribution contenant soit des données qui sont toutes différentes, soit un petit nombre de données, il est possible de simplement les énumérer.
Dans une récente enquête, on a demandé à |14| personnes de compter le nombre de minutes passées devant la télévision durant la dernière journée. Voici les différentes réponses obtenues.
|39,| |23,| |40,| |59,| |10,| |39,| |57,| |38,| |11,| |37,| |53,| |61,| |29,| |51|
On peut représenter ces données dans un tableau.
Personne | Temps (en minutes) |
---|---|
1re personne | |39| |
2e personne | |23| |
3e personne | |40| |
4e personne | |59| |
5e personne | |10| |
6e personne | |39| |
7e personne | |57| |
8e personne | |38| |
9e personne | |11| |
10e personne | |37| |
11e personne | |53| |
12e personne | |61| |
13e personne | |29| |
14e personne | |51| |
Remarque : Il aurait également été possible de représenter ces données dans un diagramme à tige et à feuilles.
Lorsqu’on fait une enquête, il est possible d’utiliser un tableau pour compiler les données avant de les analyser.
On demande à une classe de |30| élèves quel est leur sport préféré. On compile les données dans le tableau ci-dessous.
Sport | Compilation | Nombre d’élèves |
---|---|---|
Football | |6| | |
Hockey | |10| | |
Baseball | III | |3| |
Soccer | |5| | |
Danse | IIII | |4| |
Tennis | II | |2| |
Lorsque le nombre de données est très grand et que plusieurs données reviennent plus d’une fois, il est utile d'avoir recours à un tableau de données condensées, aussi appelé tableau de distribution.
Ce tableau n’est utilisé que lorsque le caractère de la variable étudiée est quantitatif discret ou qualitatif. Pour des variables à caractère quantitatif continu, on utilise les tableaux de données groupées en classes.
Un tableau de données condensées peut contenir plusieurs colonnes : valeur (ou modalité), effectif, effectif cumulé, fréquence relative et fréquence relative cumulée. De façon générale, chaque ligne est associée à une valeur ou une modalité, sauf la dernière qui représente le total de chaque colonne.
-
Une valeur est une donnée recueillie lorsque le caractère de la variable est quantitatif.
-
Une modalité est une donnée recueillie lorsque le caractère de la variable est qualitatif.
-
Un effectif est le nombre de fois qu’une donnée est représentée dans la distribution.
-
Un effectif cumulé est la somme de l’effectif d’une donnée et des effectifs des données qui la précèdent.
-
L’effectif total est le nombre total de données dans une distribution.
-
Une fréquence relative est le pourcentage correspondant à l’effectif d’une donnée par rapport à l’effectif total.
-
Une fréquence relative cumulée est le pourcentage correspondant à l’effectif cumulé d’une donnée par rapport à l’effectif total.
Pour déterminer un effectif cumulé, il faut simplement additionner les effectifs de toutes les données précédentes. Pour trouver une fréquence relative ou une fréquence relative cumulée, on peut utiliser les formules suivantes.
||\text{Fréquence relative} = \dfrac{\text{Effectif}}{\text{Effectif total}} \times 100||
||\begin{gather}\text{Fréquence}\\\text{relative cumulée}\end{gather}=\dfrac{\text{Effectif cumulé}}{\text{Effectif total}}\times100||
-
Déterminer les données.
-
Déterminer l’effectif de chaque donnée.
-
Calculer l’effectif cumulé de chaque donnée, au besoin.
-
Calculer la fréquence relative de chaque donnée, au besoin.
-
Calculer la fréquence relative cumulée de chaque donnée, au besoin.
Une personne se place dans la cour d’une école secondaire et demande l'âge des gens qu’elle croise. Elle obtient la distribution suivante.
|14,| |16,| |13,| |12,| |12,| |13,| |17,| |15,| |15,| |15,| |18,| |12,| |13,| |13,| |14,| |13,| |14,| |15,| |16,| |15,| |15,| |12,| |17,| |17,| |16,| |14,| |14,| |14,| |15,| |15,| |13,| |16,| |17,| |15,| |13,| |17,| |14,| |12,| |15,| |13|
-
Déterminer les données
Dans cette distribution, les valeurs des âges sont de |12,| |13,| |14,| |15,| |16,| |17| et |18| ans.
Âge | Effectif | Effectif cumulé | Fréquence relative |(\%)| |
Fréquence relative cumulée |(\%)| |
---|---|---|---|---|
|12| | ||||
|13| | ||||
|14| | ||||
|15| | ||||
|16| | ||||
|17| | ||||
|18| | ||||
Total |
-
Déterminer l’effectif de chaque donnée
Pour y arriver, on compte le nombre de fois où chaque valeur se trouve dans la distribution et on le note dans le tableau. On peut utiliser un tableau de compilation au besoin.
On fait ensuite le total et on trouve qu’il y a |40| données.
Âge | Effectif | Effectif cumulé | Fréquence relative |(\%)| |
Fréquence relative cumulée |(\%)| |
---|---|---|---|---|
|12| | |5| | |||
|13| | |8| | |||
|14| | |7| | |||
|15| | |10| | |||
|16| | |4| | |||
|17| | |5| | |||
|18| | |1| | |||
Total | |\boldsymbol{40}| |
-
Calculer l’effectif cumulé de chaque donnée
Pour trouver l’effectif cumulé d’une certaine valeur, on additionne son effectif et celui de toutes les valeurs précédentes.
Ainsi, pour la 1re rangée, soit celle dont la valeur est de |12| ans, l’effectif cumulée est égal à l’effectif, c’est-à-dire à |5.| Pour la 2e rangée, l’effectif cumulé est égal à |5+8,| ce qui donne |13.| Pour la 3e rangée, on fait |13+7,| ce qui donne |20.| On complète le reste de la colonne de la même manière.
Il n’y a pas de total à renseigner pour cette colonne. Par contre, on doit s’assurer que l’effectif cumulé de la dernière valeur correspond bien à l’effectif total.
Âge | Effectif | Effectif cumulé | Fréquence relative |(\%)| |
Fréquence relative cumulée |(\%)| |
---|---|---|---|---|
|12| | |5| | |5| | ||
|13| | |8| | |13| | ||
|14| | |7| | |20| | ||
|15| | |10| | |30| | ||
|16| | |4| | |34| | ||
|17| | |5| | |39| | ||
|18| | |1| | |40| | ||
Total | |\boldsymbol{40}| |
-
Calculer la fréquence relative de chaque donnée
Pour y arriver, on utilise la formule de la fréquence relative pour chaque valeur. Voici un exemple de calcul pour la valeur |14.|||\begin{align}\begin{gathered}\text{Fréquence}\\ \text{relative}\end{gathered}&= \dfrac{\text{Effectif}}{\text{Effectif total}} \times 100\\ &=\dfrac{7}{40} \times 100\\ &= 17{,}5\ \%\end{align}||Le total de cette colonne doit toujours donner |100\ \%.|
Âge | Effectif | Effectif cumulé | Fréquence relative |(\%)| |
Fréquence relative cumulée |(\%)| |
---|---|---|---|---|
|12| | |5| | |5| | |12{,}5| | |
|13| | |8| | |13| | |20{,}0| | |
|14| | |7| | |20| | |17{,}5| | |
|15| | |10| | |30| | |25{,}0| | |
|16| | |4| | |34| | |10{,}0| | |
|17| | |5| | |39| | |12{,}5| | |
|18| | |1| | |40| | |2{,}5| | |
Total | |\boldsymbol{40}| | |\boldsymbol{100{,}0}| |
-
Calculer la fréquence relative cumulée de chaque donnée
Pour y arriver, on utilise la formule de la fréquence relative cumulée pour chaque valeur. Voici un exemple de calcul pour la valeur |16.|||\begin{align}\begin{gathered}\text{Fréquence}\\\text{relative cumulée}\end{gathered}&= \dfrac{\text{Effectif cumulé}}{\text{Effectif total}} \times 100\\&=\dfrac{34}{40} \times 100\\ &\approx 85{,}0\ \%\end{align}||Il n’y a pas de total à renseigner pour cette colonne. Par contre, on doit s’assurer que la fréquence relative cumulée de la dernière valeur correspond bien à |100\ \%.|
Âge | Effectif | Effectif cumulé | Fréquence relative |(\%)| |
Fréquence relative cumulée |(\%)| |
---|---|---|---|---|
|12| | |5| | |5| | |12{,}5| | |12{,}5| |
|13| | |8| | |13| | |20{,}0| | |32{,}5| |
|14| | |7| | |20| | |17{,}5| | |50{,}0| |
|15| | |10| | |30| | |25{,}0| | |75{,}0| |
|16| | |4| | |34| | |10{,}0| | |85{,}0| |
|17| | |5| | |39| | |12{,}5| | |97{,}5| |
|18| | |1| | |40| | |2{,}5| | |100{,}0| |
Total | |\boldsymbol{40}| | |\boldsymbol{100{,}0}| |
Lorsque le nombre de valeurs différentes dans la distribution est très grand, ou que le caractère de la variable étudiée est quantitatif continu, on utilise habituellement un tableau de données groupées en classes pour organiser les données.
Un tableau de données groupées en classes contient à peu près les mêmes colonnes que le tableau de données condensées : classe, effectif, effectif cumulé, fréquence relative et fréquence relative cumulée. Seule la première colonne change, puisqu’elle passe de valeur à classe.
-
Une classe est un intervalle de valeurs qui s’écrit à l'aide de crochets.
-
L'amplitude d'une classe correspond à sa valeur la plus élevée moins sa valeur la moins élevée.
Il y a plusieurs façons différentes de séparer une distribution en classes. On détermine le nombre de classes qu’on veut (on vise généralement de 5 à 8 classes), puis on détermine l’amplitude minimale de chaque classe à l’aide de la formule suivante.
|\begin{gather}\text{Amplitude}\\ \text{minimale}\end{gather}= \dfrac{\text{Étendue}}{\text{Nombre de classes}}|
-
Déterminer les classes en trouvant leur amplitude minimale.
-
Déterminer l’effectif de chaque classe.
-
Calculer l’effectif cumulé de chaque classe, au besoin.
-
Calculer la fréquence relative de chaque classe, au besoin.
-
Calculer la fréquence relative cumulée de chaque classe, au besoin.
Lors d’une enquête à propos de l'influence du climat sur la taille des différents rongeurs, on a mesuré |20| rongeurs d'une même espèce. Voici les résultats en centimètres.
|12{,}1;| |12{,}3;| |12{,}4;| |12{,}5;| |13{,}2;| |13{,}7;| |14{,}2;| |14{,}8;| |14{,}9;| |14{,}9;| |14{,}9;| |15{,}0;| |15{,}2;| |15{,}3;| |15{,}3;| |15{,}4;| |15{,}5;| |15{,}6;| |16{,}3;| |17{,}3|
-
Déterminer les classes en trouvant leur amplitude minimale
On décide de séparer les données en |6| classes. Pour trouver l’amplitude de chaque classe, on trouve l’étendue de la distribution et on divise par le nombre de classes souhaité.||\begin{align}\begin{gathered}\text{Amplitude}\\ \text{minimale}\end{gathered}&=\dfrac{\text{Étendue}}{\text{Nombre de classes}}\\ &=\dfrac{17{,}3-12{,}1}{6}\\&=\dfrac{5{,}2}{6}\\&=0{,}8\overline{6}\end{align}||L’amplitude minimale des classe est de |0{,}8\overline{6}.| On choisit une amplitude de |1| et on commence les classes à |12.|
Taille (cm) |
Effectif | Fréquence relative |(\%)| |
---|---|---|
|[12, 13[| | ||
|[13, 14[| | ||
|[14, 15[| | ||
|[15, 16[| | ||
|[16, 17[| | ||
|[17, 18[| | ||
Total |
-
Déterminer l’effectif de chaque classe
Pour y arriver, on compte le nombre de données qui se retrouvent dans chaque classe.
Remarque : La donnée |15{,}0| doit être compilée dans la classe |[15,16[| et non dans la classe |[14,15[.|
On fait ensuite le total et on trouve qu’il y a bel et bien |20| données en tout.
Taille (cm) |
Effectif | Fréquence relative |(\%)| |
---|---|---|
|[12, 13[| | |4| | |
|[13, 14[| | |2| | |
|[14, 15[| | |5| | |
|[15, 16[| | |7| | |
|[16, 17[| | |1| | |
|[17, 18[| | |1| | |
Total | |\boldsymbol{20}| |
-
Calculer l’effectif cumulé de chaque classe
Ce n’est pas nécessaire pour cet exemple.
-
Calculer la fréquence relative de chaque classe
Pour y arriver, on utilise la formule de la fréquence relative pour chaque classe. Voici un exemple de calcul pour la classe |[15, 16[.|||\begin{align}\begin{gathered}\text{Fréquence}\\ \text{relative}\end{gathered}&= \dfrac{\text{Effectif}}{\text{Effectif total}} \times 100\\ &=\dfrac{7}{20} \times 100\\ &= 35\ \%\end{align}||Le total de cette colonne doit toujours donner |100\ \%.|
Taille (cm) |
Effectif | Fréquence relative |(\%)| |
---|---|---|
|[12, 13[| | |4| | |20| |
|[13, 14[| | |2| | |10| |
|[14, 15[| | |5| | |25| |
|[15, 16[| | |7| | |35| |
|[16, 17[| | |1| | |5| |
|[17, 18[| | |1| | |5| |
Total | |\boldsymbol{20}| | |\boldsymbol{100}| |
-
Calculer la fréquence relative cumulée de chaque classe
Ce n’est pas nécessaire pour cet exemple.