Statistiques
Représentation graphique des données
Les représentations graphiques permettent de visualiser facilement des données statistiques et d’en extraire des informations rapidement. Il existe plusieurs types de graphiques utilisés en statistiques, parmi lesquels nous allons nous concentrer sur trois : le diagramme en bâtons, l'histogramme, et le diagramme circulaire.
Diagramme en bâtons
Un diagramme en bâtons est utilisé pour représenter des données qualitatives ou discrètes. Il consiste en une série de bâtons verticaux (ou horizontaux), chacun représentant une catégorie ou une valeur. La hauteur (ou la longueur, si le diagramme est horizontal) de chaque bâton correspond à la fréquence ou à la quantité de la catégorie représentée.
- Chaque barre doit être de même largeur et espacée régulièrement pour éviter toute confusion.
- Les axes sont généralement : l'axe des abscisses représente les catégories, et l'axe des ordonnées représente la fréquence ou le nombre d'éléments dans chaque catégorie.
Histogramme
L’histogramme est utilisé pour représenter des données quantitatives continues, souvent regroupées en classes. Chaque barre de l'histogramme représente une classe d'une certaine amplitude et sa hauteur correspond à la fréquence des données qui tombent dans cette classe. Contrairement au diagramme en bâtons, les barres d’un histogramme sont généralement collées les unes aux autres, ce qui indique que les données sont continues.
- L'axe des abscisses représente l’intervalle des valeurs (les classes), et l'axe des ordonnées représente la fréquence des données dans chaque classe.
- La largeur de chaque barre dépend de l’amplitude de la classe qu'elle représente.
Diagramme circulaire
Le diagramme circulaire, ou camembert, est une autre forme de représentation graphique souvent utilisée pour illustrer la répartition de données qualitatives. Il représente un cercle divisé en plusieurs secteurs, chacun correspondant à une catégorie. La taille de chaque secteur est proportionnelle à la fréquence de la catégorie qu’il représente.
- Chaque secteur du cercle correspond à une catégorie et sa proportion par rapport au total des données.
- Ce type de graphique est souvent utilisé pour des données qui sont des parts ou des pourcentages d’un tout.
Exercice
Voici les données recueillies sur le nombre de livres lus par 10 élèves durant l’année scolaire : \{ 1, 2, 3, 1, 2, 2, 3, 1, 3, 2 \}
Représentez graphiquement ces données à l’aide d’un diagramme en bâtons et d’un diagramme circulaire.
Résolution
1. Diagramme en bâtons :
Nous avons 10 élèves avec les valeurs suivantes : \{ 1, 2, 3, 1, 2, 2, 3, 1, 3, 2 \}
.
Comptons la fréquence de chaque valeur :
- Le nombre
1
apparaît 3 fois. - Le nombre
2
apparaît 4 fois. - Le nombre
3
apparaît 3 fois.
Nous pouvons maintenant tracer le diagramme en bâtons :
- Sur l’axe des abscisses, nous placerons les valeurs
1
,2
, et3
. - Sur l’axe des ordonnées, nous placerons la fréquence des valeurs, soit
3
,4
, et3
.
Le diagramme en bâtons aura trois barres :
- La première barre (pour la valeur
1
) aura une hauteur de3
. - La deuxième barre (pour la valeur
2
) aura une hauteur de4
. - La troisième barre (pour la valeur
3
) aura une hauteur de3
.
2. Diagramme circulaire :
Pour réaliser un diagramme circulaire, nous devons d’abord calculer la proportion de chaque valeur dans l’ensemble des données :
- Le nombre total de livres lus est
1 + 1 + 1 + 2 + 2 + 2 + 3 + 3 + 3 = 18
. - La proportion des élèves ayant lu
1
livre est\frac{3}{18} = \frac{1}{6}
. - La proportion des élèves ayant lu
2
livres est\frac{4}{18} = \frac{2}{9}
. - La proportion des élèves ayant lu
3
livres est\frac{3}{18} = \frac{1}{6}
.
Nous pouvons maintenant dessiner un cercle, en divisant chaque portion du cercle en fonction des proportions ci-dessus :
- Le secteur correspondant au nombre
1
aura un angle de\frac{1}{6} \times 360^\circ = 60^\circ
. - Le secteur correspondant au nombre
2
aura un angle de\frac{2}{9} \times 360^\circ \approx 80^\circ
. - Le secteur correspondant au nombre
3
aura un angle de\frac{1}{6} \times 360^\circ = 60^\circ
.
Ainsi, le diagramme circulaire aura trois secteurs, chacun correspondant à une des valeurs 1
, 2
, et 3
, et leur taille respectera les proportions calculées.
Calculer une moyenne
La moyenne d'une série de nombres est une mesure statistique qui permet de déterminer la valeur centrale de cet ensemble de données. Elle est calculée en ajoutant toutes les valeurs de la série, puis en divisant cette somme par le nombre total de valeurs.
Définition de la moyenne
La moyenne d'une série de nombres est donnée par la formule suivante :
\( \text{Moyenne} = \frac{\sum x_i}{n} \)
- \( x_i \) : Chaque valeur de la série.
- \( n \) : Le nombre total de valeurs de la série.
- \( \sum x_i \) : La somme de toutes les valeurs de la série.
La moyenne représente la "valeur moyenne" des éléments de la série, offrant ainsi une idée générale de leur tendance centrale.
Exemple :
Prenons l'exemple suivant : une classe a obtenu les notes suivantes à un test : 12, 14, 15, 10, 18.
1. Additionnons les notes :
\( 12 + 14 + 15 + 10 + 18 = 69 \)
2. Divisons cette somme par le nombre de notes (ici, 5) :
\( \text{Moyenne} = \frac{69}{5} = 13,8 \)
Ainsi, la moyenne des notes de la classe est 13,8.
Exercice
La série de nombres suivante représente le nombre de livres lus par des élèves durant une année scolaire : 4, 6, 8, 5, 7, 10, 3.
Calculez la moyenne du nombre de livres lus.
Résolution
1. Additionnons toutes les valeurs de la série :
\( 4 + 6 + 8 + 5 + 7 + 10 + 3 = 43 \)
2. Divisons cette somme par le nombre total d'élèves, qui est 7 :
\( \text{Moyenne} = \frac{43}{7} \approx 6,14 \)
La moyenne du nombre de livres lus est donc d'environ 6,14 livres.
Calculer une médiane, une étendue
Dans cette section, nous allons explorer la manière de calculer la médiane et l'étendue d'un ensemble de données. Ces mesures permettent d'analyser la répartition des valeurs et sont particulièrement utiles pour résumer un ensemble de données.
Médiane
La médiane est la valeur qui divise un ensemble de données ordonné en deux parties égales. Si l'ensemble contient un nombre impair de valeurs, la médiane est la valeur centrale. Si l'ensemble contient un nombre pair de valeurs, la médiane est la moyenne des deux valeurs centrales.
Étendue
L'étendue est la différence entre la plus grande et la plus petite valeur d'un ensemble de données. Elle permet de mesurer l'amplitude des valeurs dans l'ensemble.
Exercice
Voici un ensemble de données : 4, 7, 9, 15, 20, 22, 25. Calculez la médiane et l'étendue de cet ensemble.
Résolution
Médiane : Pour déterminer la médiane, nous devons d'abord ordonner les données (elles le sont déjà ici) : 4, 7, 9, 15, 20, 22, 25.
Il y a 7 valeurs dans l'ensemble, donc la médiane est la valeur au centre de cet ensemble. La 4ème valeur est 15. Ainsi, la médiane est égale à 15.
Étendue : L'étendue est la différence entre la plus grande et la plus petite valeur. La plus grande valeur est 25 et la plus petite valeur est 4. Ainsi, l'étendue est :
\( \text{Étendue} = 25 - 4 = 21 \).
Capacités attendues
- Savoir représenter graphiquement des données à l'aide de diagrammes en bâtons, histogrammes et diagrammes circulaires.
- Être capable de calculer la moyenne d'un ensemble de données.
- Être capable de calculer la médiane d'un ensemble de données.
- Être capable de déterminer l'étendue d'un ensemble de données.
- Analyser et interpréter des graphiques pour en extraire des informations pertinentes.
- Utiliser les mesures statistiques pour décrire et comparer des ensembles de données.
Librairies :
- Bootstrap: https://getbootstrap.com
- Font Awesome: https://fontawesome.com
- jQuery: https://jquery.com
- MathJax: https://www.mathjax.org