Statistiques et traitement des données

Maintenant que tu sais organiser et représenter des données, passons à l’analyse ! 🧠 Dans cette leçon, nous allons découvrir comment résumer une série statistique à l’aide de paramètres significatifs.

📏 Les paramètres de position

Ces paramètres nous indiquent autour de quelle valeur se concentrent nos données.

La moyenne arithmétique

C’est le paramètre de position le plus connu. Pour une série simple, la formule est :

\bar{x} = \frac{x_1 + x_2 + ... + x_n}{n}

Exemple : Les notes de Lucie sont 12, 15, 8, 14 et 16. Sa moyenne est :

\bar{x} = \frac{12 + 15 + 8 + 14 + 16}{5} = \frac{65}{5} = 13

Pour une série avec effectifs, on utilise la moyenne pondérée :

\bar{x} = \frac{n_1x_1 + n_2x_2 + ... + n_kx_k}{N}

Prenons l’exemple des tailles d’un groupe :

  • 165 cm : 3 personnes
  • 170 cm : 5 personnes
  • 175 cm : 2 personnes

\bar{x} = \frac{3 \times 165 + 5 \times 170 + 2 \times 175}{10} = \frac{1695}{10} = 169,5 \text{ cm}

La médiane

La médiane est la valeur qui partage la série en deux groupes de même effectif. C’est une mesure robuste, peu sensible aux valeurs extrêmes.

Pour la trouver :

  1. Ordonner les valeurs dans l’ordre croissant
  2. Si l’effectif est impair : prendre la valeur centrale
  3. Si l’effectif est pair : prendre la moyenne des deux valeurs centrales

Exemple avec 7 valeurs : 8, 10, 12, 14, 15, 16, 18 → Médiane = 14

Exemple avec 8 valeurs : 5, 8, 10, 12, 14, 16, 18, 20 → Médiane = (12+14)/2 = 13

📐 Les paramètres de dispersion

Ces paramètres mesurent l’étalement des données autour de la valeur centrale.

L’étendue

C’est la différence entre la plus grande et la plus petite valeur :

E = x_{\text{max}} - x_{\text{min}}

Pour les notes 8, 12, 14, 15, 16 : Étendue = 16 – 8 = 8

L’écart interquartile</h4

Plus sophistiqué que l’étendue, il mesure la dispersion des 50% de valeurs centrales.

Les quartiles divisent la série en quatre parties égales :

  • Q1 : 25% des valeurs lui sont inférieures
  • Q2 : c’est la médiane (50%)
  • Q3 : 75% des valeurs lui sont inférieures

L’écart interquartile se calcule ainsi :

EI = Q_3 - Q_1

Exemple avec la série : 5, 7, 8, 10, 12, 14, 15, 16, 18, 20

Q1 = 8 (25% des valeurs), Q3 = 16 (75% des valeurs)

EI = 16 - 8 = 8

📊 La variance et l’écart-type

Ce sont les paramètres de dispersion les plus utilisés en statistiques.

La variance mesure la moyenne des carrés des écarts à la moyenne :

V = \frac{1}{n} \sum_{i=1}^{n} (x_i - \bar{x})^2

L’écart-type est la racine carrée de la variance :

\sigma = \sqrt{V}

Prenons un exemple concret avec les notes : 10, 12, 14

Moyenne : ¯x = 12

Calcul de la variance :

V = \frac{(10-12)^2 + (12-12)^2 + (14-12)^2}{3} = \frac{4 + 0 + 4}{3} = \frac{8}{3} \approx 2,67

Écart-type :

\sigma = \sqrt{2,67} \approx 1,63

🎯 Application complète

Analysons ensemble les salaires mensuels dans une petite entreprise (en euros) :

1800, 1900, 2000, 2000, 2100, 2200, 2500, 3000, 3500, 5000

Moyenne :

\bar{x} = \frac{1800+1900+2000+2000+2100+2200+2500+3000+3500+5000}{10} = 2600

Médiane : entre la 5e et 6e valeur → (2100+2200)/2 = 2150

Étendue : 5000 – 1800 = 3200

Quartiles : Q1 = 2000, Q3 = 3000

Écart interquartile : 3000 – 2000 = 1000

Que remarques-tu ? La moyenne (2600€) est plus élevée que la médiane (2150€) à cause d’un salaire très élevé (5000€). C’est pourquoi il est souvent utile de calculer plusieurs paramètres !

💡 Astuce mnémotechnique

Pour retenir l’ordre des quartiles :

  • Q1 : 1 quart des données en dessous
  • Q2 : 2 quarts (la moitié) en dessous
  • Q3 : 3 quarts en dessous

Tu maîtrises maintenant les paramètres essentiels pour analyser une série statistique à une variable. Dans la prochaine leçon, nous explorerons les relations entre deux variables ! 🔗