Notion de statistique en sciences physiques

DOC. N° 03

Notion de statistiques

pour les

sciences physiques

I- Définitions.

graphe : loi normale

II- Les paramètres de position.

1)- La moyenne : moyenne pondérée, moyenne arithmétique.

2)- Le mode :

3)- La médiane :

4)- Les paramètres de dispersion.

5)- La Loi Normale.

6)- Estimation.

III- Droite de régression.

1)- Situation expérimentale.

2)- Autre méthode utilisée.

3)- Corrélation.

IV- Exploitation.

1)- Caractéristique d’un générateur.

2)- Exemple d’ajustement se ramenant à un ajustement affine.

Exemple 1 :
Caractère aléatoire du phénomène de désintégration radioactive

Exemple 2 :
Mesure de la valeur d'une résistance. Dispersion des valeurs

I- Définitions.

- On appelle x, le caractère étudié.

- On appelle x_i la valeur numérique du caractère étudié.

- L’effectif, noté n_i, est le nombre de mesures donnant le résultat x_i.

- La fréquence fréquence f = ni / n , ou n est le nombre total de mesures :

II- Les paramètres de position.

1)- La moyenne : moyenne pondérée, moyenne arithmétique.

- On la note

- Formule :

- Cette moyenne est le paramètre de position le plus couramment utilisé et le plus rapide à calculer.

2)- Le mode :

- C’est la valeur de x qui correspond à l’effectif maximum.

3)- La médiane :

- Il y a autant de mesures supérieures que de mesures inférieures à cette valeur.

4)- Les paramètres de dispersion.

a)- L’écart moyen. (écart arithmétique ou moyenne des écarts).

- On peut calculer l’écart absolu d’une mesure : et faire la moyenne pondérée de ces écarts pour obtenir l’écart moyen que l’on note e.

- écart moyen

b)- L’écart type. On utilise surtout en statistique l’écart type ou l’écart quadratique moyen, noté σ.

- Le calcul de l’écart type découle de celui de la variance car l’écart type est égal à la racine carrée de la variance.

- La variance peut se calculer à partir de la formule de Kœnig :

- variance

- En conséquence : écart-type = racine (variance)

c)- L’intervalle interquartile.

- Le premier quartile Q₁ : il y a 25 % de mesures inférieures.

- Le troisième quartile Q₃ : il y a 25 % de mesures supérieures.

- Le deuxième quartile Q₂ : c’est la médiane.

- Il y a 50 % de mesures dans l’intervalle interquartile [Q₁, Q₂].

x_i	n_i
996	1
997	3
998	8
999	10
1000	15
1001	19
1002	14
1003	10
1004	8
1005	5
1006	4
1007	2
1008	1

- Effectif total : n = 100 ; Moyenne : ; e ≈ 1,979 : σ ≈ 2,47 ;

d)- Remarque :

- ces trois paramètres de dispersion sont liés entre eux lorsque la distribution est normale ou lorsque la distribution est pratiquement normale.

- σ ≈ 1,25 e

- Dans cet exemple : σ ≈ 2,47 et σ ≈ 1,25 e => σ ≈ 1,25 e

- Dans cet exemple : σ ≈ 2,47 ;

- L’écart est important car il est difficile de déterminer les valeurs des différents quartiles.

5)- La Loi Normale.

- On démontre en statistique que la distribution des mesures, lorsque le nombre de mesures augmente tend vers une distribution normale dite de Gauss – Laplace.

- Le nombre de mesures doit être supérieur à 50.

- La Loi Normale :

- On démontre en probabilité que

- Si représente la moyenne, σ l‘écart-type et x une valeur incluse dans l'ensemble de données, alors

- environ 68 % des données se situent à l'intérieur de l'intervalle : .

- environ 95 % des données se situent à l'intérieur de l'intervalle : .

- Environ 99 % des données se situent à l'intérieur de l'intervalle : .

6)- Estimation.

- Dans le cas d’une expérience de physique, on se heurte à des problèmes d’estimation.

- Si l’on a une série de n mesures d’une grandeur x (résistance, nombre d’impulsions d’une source radioactive, …), on peut calculer :

- La moyenne ,

- L’écart type σ, de cette série de mesures.

- Mais la valeur de la moyenne ne représente qu’une estimation, une valeur approchée de la valeur réelle inconnue notée x.

- On démontre que lorsque la distribution ressemble à une loi normale, la probabilité pour que x appartienne à l’intervalle de confiance ; est supérieure à 99 %.

- relation : incertitude ; h est la constante de Student. Elle est donnée par les tables de Student.

- La grandeur ɛ est appelée incertitude, erreur standard ou écart probable.

n	h à 99 %	h à 95 %
51	2,678	2,009
61	2,660	2,000
81	2,639	1,990
101	2,626	1,984
201	2,601	1,972
501	2,586	1,965
1001	2,576	1,960

- Dans l’exemple précédent : comme n = 100, h ≈ 2,626

- Valeur de ɛ : epsilon = 0,65

- La probabilité pour que x Î ] 1000, 1002 [ est de 99 %.

III- Droite de régression.

1)- Situation expérimentale.

- La tension U_PN aux bornes d’un générateur qui débite dans un circuit l’intensité I vérifie la loi théorique :

U_PN = E – r . I {	E : f.e.m en volt (V)
	r : résistance interne en ohm (Ω)

- Les valeurs expérimentales sont les suivantes :

I en A	0,15	0,26	0,38	0,52	0,72	0,92	1,00
U en V	3,82	3,59	3,33	3,10	2,77	2,41	2,19

- En reportant les valeurs sur du papier millimétré, on constate que les points expérimentaux sont sensiblement alignés.

- Pour que l’expérience permette de déterminer les grandeurs E et r, il faudrait connaître la droite qui s’ajuste le mieux aux données expérimentales.

- On peut faire un ajustement graphique par tâtonnement (On dit alors que l’on trace la droite moyenne : méthode que l’on utilise en classe de seconde).

2)- Autre méthode utilisée.

- Une autre méthode très utilisée, est la méthode des moindres carrés.

a)- Méthode des moindres carrés verticaux.

- On cherche par le calcul, la droite telle que la somme des carrés des distances verticales entre les points et la droite soit minimale.

- Exemple : On possède n points expérimentaux (x ₁ ; y ₁), (x ₂ ; y ₂), (x ₃ ; y ₃), ……(x _n ; y _n).

- Dans notre exemple, les points expérimentaux sont sensiblement alignés.

- On cherche une droite D d’équation : y = a . x + b.

Méthode des moindres carrés verticaux

- La droite D est telle que la somme S des carrés des écarts verticaux est minimale :

- somme S des carrés des écarts verticaux (1)

► première étape : supposons que la valeur de a est fixée. En conséquence, la seule variable est b.

- S est minimum si : S minimum .

- À l’aide de l’expression (1), on peut calculer la dérivée première de S par rapport à b :

- expression

- On peut calculer la dérivée seconde :

- dérivée seconde

- En conséquence : dérivée seconde

- On est bien en présence d’un minimum.

- relation

- Or : YM et XM

- b = y_M – a . x_M

- Cela signifie que, parmi toutes les droites de coefficient directeur donné a, celui qui rend S minimum, est celle qui passe par le point moyen M de coordonnées (x _M ; y _M).

► Deuxième étape : On fait le changement de variable suivant :

- changement de variable

- On se limite aux droites passant par le point M. Ces droites ont pour équation :

- Y = a . X.

- expression de S

- S est minimum par rapport à la variable a si relation .

- expression de S

- On est bien en présence d’un minimum.

- Détermination de l’expression de a :

- expression de a

- Expression qui permet le calcul de la valeur de a :

- Or : changement de variable

- expression de a

- à partir de la valeur de a, on peut en déduire celle de b grâce à l’expression :

- b = y_M – a . x_M

- La droite obtenue d’équation : y = a . x + b est appelée droite de régression de y en x.

b)- Méthode des moindres carrés horizontaux.

- On cherche par le calcul, la droite telle que la somme des carrés des distances horizontales entre les points et la droite soit minimale.

- Exemple : On possède n points expérimentaux (x ₁ ; y ₁), (x ₂ ; y ₂), (x ₃ ; y ₃), ……(x _n ; y _n).

- Dans notre exemple, les points expérimentaux sont sensiblement alignés.

- On cherche une droite D’ d’équation : y = a’ . x + b’.

Méthode des moindres carrés horizontaux

- La droite D’ est telle que la somme S des carrés des écarts horizontaux est minimale :

- somme S des carrés des écarts horizontaux (1)

► première étape : supposons que la valeur de a’ est fixée. En conséquence, la seule variable est b’.

- S est minimum si conditions .

- À l’aide de l’expression (1), on peut calculer la dérivée première de S par rapport à b :

- expression 01

- Puis la dérivée seconde par rapport à b’.

- dérivée seconde Il s’agit bien d’un minimum.

- En conséquence, S est minimum si

- expression

- Or : expressions de YM et XM

- b’ = y_M – a’ . x_M

- Cela signifie que, parmi toutes les droites de coefficient directeur donné a’, celui qui rend S minimum, est celle qui passe par le point moyen M de coordonnées (x_M ; y_M).

► Deuxième étape : On fait le changement de variable suivant :

- changement de variable

- On se limite aux droites passant par le point M. Ces droites ont pour équation :

- Y = a . X.

- On remplace b’ par son expression dans S.

- expressions de S

- S est minimum par rapport à la variable a’ si S minimum .

- dérivé

- Détermination de l’expression de a’ :

- expression de a'

- Expression qui permet le calcul de la valeur de a’ :

- Or : changement de variable

- expression de a'

- à partir de la valeur de a’, on peut en déduire celle de b’ grâce à l’expression : b’ = y_M – a’ . x_M

- La droite obtenue d’équation : y = a’ . x + b est appelée droite de régression de x en y.

3)- Corrélation.

a)- Le coefficient de corrélation.

- Le coefficient de corrélation linéaire r est défini par l’expression suivante :

- Si | r | = 1 les deux droites D et D’ sont confondues. Tous les points du nuage de points sont alignés. Il y a corrélation linéaire.

- Si r = 0 il n’y a pas de corrélation linéaire.

- Si | r | ≈ 1 il y a dépendance linéaire statistique entre les variables x et y.

IV- Exploitation.

1)- Caractéristique d’un générateur.

- La tension U_PN aux bornes d’un générateur qui débite dans un circuit l’intensité I vérifie la loi théorique :

U_PN = E – r . I {	E : f.e.m en volt (V)
	r : résistance interne en ohm (Ω)

a)- Tableau de valeurs.

I en A	0,15	0,26	0,38	0,52	0,72	0,92	1
U en V	3,82	3,59	3,33	3,10	2,77	2,41	2,19

b)- Exploitation.

- Graphe : U_PN = f (I).

- Une calculatrice graphique ou un tableur permet de déterminer l’équation de la droite et de donner le coefficient de corrélation et le coefficient de détermination.

graphique

- Il faut interpréter le résultat :

- La force électromotrice du générateur est donnée par la valeur de l’ordonnée à l’origine E ≈ 4,08 V

- La résistance interne du générateur est donnée par la valeur absolue du coefficient directeur de la droite D.

- r ≈ 1,86 Ω.

- Le coefficient de corrélation .

- Il y a une dépendance linéaire entre les grandeurs U_PN et I.

- Le résultat est en adéquation avec le modèle choisi :

- U_PN = -1,86 I + 4,08.

2)- Exemple d’ajustement se ramenant à un ajustement affine.

► Dans une substance radioactive, si N₀ désigne le nombre de noyaux radioactifs au temps 0, le nombre N d’atomes radioactifs présents au temps t est donné par la relation :

- N = N₀ . e ^{– λ.t}.

- À partir de l’indium radioactif, on a obtenu les résultats suivants :

en min

- On peut donner une autre formulation de la loi théorique pour ramener notre étude à celle d’une fonction affine.

- ln (N / N0 ) = lambda . t

- On détermine la valeur de λ à l’aide d’un ajustement linéaire à partir des valeurs de y = ln (N / N0) et de x = t.

- On calcule la droite de régression de y par rapport à x.

t en min	0	5	10	15	20	25	30	35	40
N	98	92	87	80	73	70	67	63	60
	0	-0.0632	-0.1196	-0.2029	-0.2945	-0.3365	-0.3803	-0.4418	-0.4906

- Représentation graphique et exploitation.

- ln (N / N0 ) = lambda . t avec λ ≈ 0,0125 min^{–
1}.

- Comme on s’est ramené à un ajustement affine en utilisant une fonction logarithmique, on dit que l’on a procédé à un ajustement logarithmique.

- On peut retrouver la durée de demi-vie : t 1/2 = 55,5 min .