Statistiques
Fréquence
En statistiques, la notion de fréquence est essentielle pour analyser la répartition des données dans un ensemble. La fréquence d'un élément dans un ensemble de données correspond à son nombre d'occurrences ou à la proportion d'occurrences par rapport au nombre total de données.
Fréquence absolue
La fréquence absolue d'une donnée est simplement le nombre de fois où cette donnée apparaît dans l'échantillon ou la population. Par exemple, si on a les valeurs suivantes dans un échantillon de 10 données : \( 2, 4, 4, 5, 5, 5, 5, 6, 7, 8 \), la fréquence absolue de la valeur \( 5 \) est \( 4 \) (puisque \( 5 \) apparaît 4 fois).
Fréquence relative
La fréquence relative d'une donnée est le rapport de sa fréquence absolue au nombre total de données. Elle permet d'exprimer la fréquence sous forme de proportion, ce qui facilite la comparaison entre différents ensembles de données de tailles différentes.
\( f_{\text{rel}}(x) = \frac{f_{\text{abs}}(x)}{n} \) où \( f_{\text{abs}}(x) \) est la fréquence absolue de la donnée \( x \) et \( n \) est le nombre total d'éléments dans l'échantillon.
Fréquence cumulée
La fréquence cumulée d'une donnée est la somme des fréquences absolues de toutes les données inférieures ou égales à cette donnée. Elle permet de suivre l'accumulation des données en fonction de leur ordre.
\( F(x) = \sum_{i \leq x} f_{\text{abs}}(i) \) où \( F(x) \) est la fréquence cumulée jusqu'à la donnée \( x \).
Exercice
On considère l'échantillon de 10 notes suivantes : \( 12, 15, 15, 18, 20, 15, 17, 17, 12, 18 \). On souhaite déterminer la fréquence absolue, la fréquence relative et la fréquence cumulée de chaque note.
Résolution
1. Fréquences absolues :
On commence par compter le nombre d'occurrences de chaque note dans l'échantillon :
- La note \( 12 \) apparaît 2 fois.
- La note \( 15 \) apparaît 3 fois.
- La note \( 17 \) apparaît 2 fois.
- La note \( 18 \) apparaît 2 fois.
- La note \( 20 \) apparaît 1 fois.
Le tableau des fréquences absolues est donc :
Note | Fréquence absolue |
---|---|
12 | 2 |
15 | 3 |
17 | 2 |
18 | 2 |
20 | 1 |
2. Fréquences relatives :
Le nombre total d'éléments est \( n = 10 \). On calcule la fréquence relative de chaque note en divisant la fréquence absolue de chaque note par le nombre total de données :
- \( f_{\text{rel}}(12) = \frac{2}{10} = 0,2 \)
- \( f_{\text{rel}}(15) = \frac{3}{10} = 0,3 \)
- \( f_{\text{rel}}(17) = \frac{2}{10} = 0,2 \)
- \( f_{\text{rel}}(18) = \frac{2}{10} = 0,2 \)
- \( f_{\text{rel}}(20) = \frac{1}{10} = 0,1 \)
Le tableau des fréquences relatives est donc :
Note | Fréquence relative |
---|---|
12 | 0,2 |
15 | 0,3 |
17 | 0,2 |
18 | 0,2 |
20 | 0,1 |
3. Fréquences cumulées :
On calcule les fréquences cumulées en additionnant successivement les fréquences absolues. La fréquence cumulée pour une note est la somme des fréquences des notes inférieures ou égales à cette note. Ainsi, les fréquences cumulées sont calculées comme suit :
- \( F(12) = 2 \)
- \( F(15) = 2 + 3 = 5 \)
- \( F(17) = 5 + 2 = 7 \)
- \( F(18) = 7 + 2 = 9 \)
- \( F(20) = 9 + 1 = 10 \)
Le tableau des fréquences cumulées est donc :
Note | Fréquence cumulée |
---|---|
12 | 2 |
15 | 5 |
17 | 7 |
18 | 9 |
20 | 10 |
Moyenne pondérée et linéarité de la moyenne
Définition de la moyenne pondérée
La moyenne pondérée est un moyen de calculer une moyenne où chaque valeur possède un poids, ce qui permet de tenir compte de l'importance de chaque valeur dans le calcul de la moyenne.
Soit un ensemble de n valeurs x_1, x_2, \dots, x_n, associées à des poids respectifs p_1, p_2, \dots, p_n. La moyenne pondérée M_p est définie par la formule :
M_p = \frac{p_1 \times x_1 + p_2 \times x_2 + \dots + p_n \times x_n}{p_1 + p_2 + \dots + p_n}
Propriété de linéarité de la moyenne
La linéarité de la moyenne est une propriété qui permet de dire que la moyenne pondérée d'une combinaison linéaire de valeurs est égale à la combinaison linéaire des moyennes pondérées des valeurs concernées. Cela peut être exprimé comme suit :
M_p(x + y) = M_p(x) + M_p(y)
Exercice
Une classe de 30 élèves a passé deux tests : un test de mathématiques et un test de physique. Les résultats du test de mathématiques sont pondérés par un coefficient de 2, et ceux du test de physique par un coefficient de 1. Voici les moyennes des élèves pour chaque test :
- Moyenne des résultats en mathématiques : 15/20
- Moyenne des résultats en physique : 12/20
Calculer la moyenne générale pondérée de la classe.
Résolution
La moyenne générale pondérée est calculée en utilisant la formule de la moyenne pondérée :
M_p = \frac{(p_{\text{math}} \times x_{\text{math}}) + (p_{\text{phy}} \times x_{\text{phy}})}{p_{\text{math}} + p_{\text{phy}}}
Nous avons les données suivantes :
- x_{\text{math}} = 15 (moyenne en mathématiques)
- x_{\text{phy}} = 12 (moyenne en physique)
- p_{\text{math}} = 2 (poids des mathématiques)
- p_{\text{phy}} = 1 (poids de la physique)
En remplaçant les valeurs dans la formule :
M_p = \frac{(2 \times 15) + (1 \times 12)}{2 + 1}
M_p = \frac{30 + 12}{3}
M_p = \frac{42}{3}
M_p = 14
La moyenne générale pondérée de la classe est donc de 14/20.
Quartiles et écart-type
Les quartiles et l'écart-type sont des outils statistiques utilisés pour décrire la répartition des données d'une série statistique.
Définition des quartiles
Les quartiles sont des valeurs qui divisent une série de données en quatre parts égales. Ils sont utilisés pour décrire la distribution des données.
- Premier quartile (Q1) : c'est la valeur qui sépare le premier quart des données (25 % inférieur).
- Deuxième quartile (Q2) : c'est la médiane de la série, c'est-à-dire la valeur qui sépare la série en deux parties égales (50 %).
- Troisième quartile (Q3) : c'est la valeur qui sépare le troisième quart des données (75 % supérieur).
Définition de l'écart-type
L'écart-type est une mesure de la dispersion des valeurs d'une série de données autour de la moyenne. Il est défini comme la racine carrée de la variance.
L'écart-type permet de savoir si les valeurs sont concentrées autour de la moyenne ou dispersées.
Exercice
Voici la série de données suivante : 4, 8, 6, 5, 7, 3, 9, 10, 2, 1.
Calculez les quartiles Q1, Q2 et Q3 ainsi que l'écart-type de cette série de données.
Résolution
1. Calcul des quartiles :
Tout d'abord, nous devons trier les données par ordre croissant : 1, 2, 3, 4, 5, 6, 7, 8, 9, 10.
Le premier quartile (Q1) est la médiane de la première moitié des données (1, 2, 3, 4, 5). La médiane de ces données est 3.
Le deuxième quartile (Q2), ou la médiane de l'ensemble des données, est la médiane de la série complète (1, 2, 3, 4, 5, 6, 7, 8, 9, 10). La médiane ici est la moyenne des deux valeurs centrales 5 et 6, soit :
Le troisième quartile (Q3) est la médiane de la deuxième moitié des données (6, 7, 8, 9, 10). La médiane de ces données est 8.
2. Calcul de l'écart-type :
La moyenne des données est :
Ensuite, nous calculons la variance en utilisant la formule :
La somme des carrés des écarts est :
Donc, la variance est :
Enfin, l'écart-type est la racine carrée de la variance :
Capacités attendues
- Calculer et interpréter les fréquences dans un ensemble de données.
- Calculer une moyenne pondérée et comprendre son utilisation dans des contextes variés.
- Appliquer la linéarité de la moyenne pour résoudre des problèmes impliquant des données pondérées.
- Calculer les quartiles et interpréter leur signification dans l'analyse des données.
- Calculer l'écart-type d'un ensemble de données et en comprendre l'importance pour mesurer la dispersion.
- Utiliser les quartiles et l'écart-type pour comparer des ensembles de données et en déduire des informations sur leur répartition.
Librairies :
- Bootstrap: https://getbootstrap.com
- Font Awesome: https://fontawesome.com
- jQuery: https://jquery.com
- MathJax: https://www.mathjax.org