Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Les statistiques descriptives sont un ensemble de méthodes permettant de décrire et de résumer des ensembles de données par le biais de calculs numériques, de tableaux ou de graphiques. Cet article a pour but d’expliquer les concepts fondamentaux des statistiques descriptives ainsi que les différentes méthodes utilisées pour effectuer ces calculs. Nous explorerons également des applications concrètes et des exercices pratiques pour mieux comprendre l’utilité de ces mesures.
Sommaire
Les statistiques descriptives permettent de simplifier, résumer et interpréter un grand volume de données en quelques chiffres clés. Parmi les concepts principaux, on trouve :
La moyenne arithmétique est la somme de toutes les valeurs d’un ensemble de données divisée par le nombre total de valeurs. C’est l’une des mesures les plus couramment utilisées.
Exemple : Pour les valeurs 5, 7, 9, la moyenne est (5 + 7 + 9) / 3 = 21 / 3 = 7.
La médiane est la valeur qui divise un ensemble de données ordonnées en deux parties égales. Si le nombre de valeurs est impair, c’est la valeur centrale ; s’il est pair, c’est la moyenne des deux valeurs centrales.
Exemple : Pour les valeurs 3, 8, 12, la médiane est 8. Pour les valeurs 3, 8, 12, 20, la médiane est (8 + 12) / 2 = 10.
Le mode est la valeur qui apparaît le plus fréquemment dans un ensemble de données.
Exemple : Dans la série de valeurs 1, 2, 2, 3, 4, le mode est 2.
L’écart-type mesure la dispersion des valeurs autour de la moyenne. La variance est l’écart moyen au carré des valeurs par rapport à la moyenne. Elles fournissent des informations sur la variabilité des données.
Exemple : Pour les valeurs 2, 4, 4, 4, 5, 5, 7, 9 :
Pour tout ce qui concerne les mathématiques et les formules statistiques complexes, vous pouvez accéder à la rubrique maths. Explorons maintenant comment calculer les principales mesures statistiques avec divers exemples et méthodes de calcul.
La formule générale pour la moyenne arithmétique (μ) d’un ensemble de N observations (X1, X2, …, XN) est :
μ = (ΣX) / N.
Exemple : Soit l’ensemble de données {10, 20, 30}, la moyenne arithmétique est (10 + 20 + 30) / 3 = 60 / 3 = 20.
Pour trouver la médiane, il est essentiel de classer d’abord les données par ordre croissant.
Exemple : Soit l’ensemble de données non triées {40, 10, 50}. Une fois triées, elles deviennent {10, 40, 50} et la médiane est 40.
Le mode correspond à la valeur qui revient le plus souvent dans le jeu de données. En cas de multimodalité, plusieurs modes peuvent exister.
Exemple : Pour les données {7, 8, 7, 3, 2, 1, 8}, les modes sont 7 et 8.
La variance (σ²) se calcule comme suit pour une population entière :
σ² = Σ (X – μ)² / N, où X représente chaque valeur individuelle, μ est la moyenne et N est le nombre total de valeurs.
L’écart-type (σ) est la racine carrée de la variance :
σ = √σ².
Lorsque nous travaillons avec un échantillon, la formule change légèrement pour corriger le biais :
s² = Σ (X – x̄)² / (n – 1),
où s² est la variance de l’échantillon, X représente toutes les valeurs, x̄ est la moyenne de l’échantillon, et n est le nombre total de valeurs.
Utiliser les statistiques descriptives permet de prendre des décisions éclairées dans divers domaines comme la recherche, l’économie, et même la vie quotidienne. Voici quelques exemples d’applications pratiques.
Les enseignants utilisent les statistiques pour analyser les performances des élèves, identifier ceux qui pourraient avoir besoin d’aide supplémentaire. Par exemple, ils peuvent calculer la moyenne des notes d’une classe, déterminer le taux de réussite et identifier les points forts et faibles de leurs étudiants.
Exercice pratique : Supposez qu’un professeur a les notes suivantes pour cinq élèves : 85, 90, 78, 88, 92. Calculez la moyenne, la médiane et identifiez si un mode existe.
Les statisticiens en santé publique analysent les données médicales pour surveiller l’évolution des maladies, déterminer les causes de maladies ou mesurer l’efficacité des traitements. La variance et l’écart-type peuvent illustrer la variabilité de paramètres médicaux entre différentes sections de populations.
Exercice pratique : Imaginez que vous avez les données pour le cholestérol de dix patients : 190, 200, 150, 210, 160, 180, 170, 220, 230, 140. Calculez la variance et l’écart-type.
Les entreprises se servent des statistiques descriptives pour analyser le comportement des consommateurs et ajuster leur stratégie marketing. En mesurant les ventes moyennes, la répartition des ventes, elles peuvent repérer les tendances et optimiser les stocks.
Exercice pratique : Prenons un magasin qui vend cinq produits avec les ventes respectives suivantes (en unités) : 50, 60, 55, 70, 65. Calculez la moyenne et l’écart-type des ventes.
Pour aller plus loin dans l’analyse descriptive, d’autres concepts sont souvent utilisés tels que les quartiles, le coefficient de variation, et l’asymétrie (skewness).
Les quartiles divisent un ensemble de données en quatre parties égales. Les percentiles font la même chose mais en cent parties. Le premier quartile (Q1) correspond au 25ème percentile, le deuxième quartile (Q2) est la médiane, et le troisième quartile (Q3) est le 75ème percentile.
Exemple : Pour les données {10, 20, 30, 40, 50}, Q1 est 20, Q2 est 30 et Q3 est 40.
Ce coefficient est utilisé pour comparer la dispersion relative de différentes séries de données, en tenant compte de différences d’échelle.
Formule générale :
CV = (σ/μ) * 100
Exemple : Si les salaires moyens dans deux départements sont de 2000€ et 5000€ et que leurs écarts-types sont respectivement de 200€ et 800€, les CV seront (200/2000)*100 = 10% et (800/5000)*100 = 16%, montrant une plus grande dispersion relative dans le second département.
Ce terme quantifie le degré de symétrie d’une distribution. Une asymétrie positive indique une queue plus longue à droite, tandis qu’une asymétrie négative montre une queue plus longue à gauche.
Exemple : Une distribution des revenus avec une majorité de faibles revenus et quelques très hauts revenus aura une asymétrie positive.