Notion de statistique en sciences physiques

DOC. N° 03

Notion de statistiques

pour les

sciences physiques

 

 

 
 

I- Définitions.

II- Les paramètres de position.

1)- La moyenne : moyenne pondérée, moyenne arithmétique.

2)- Le mode :

3)- La médiane :

4)- Les paramètres de dispersion.

5)- La Loi Normale.

6)- Estimation.

III- Droite de régression.

1)- Situation expérimentale.

2)- Autre méthode utilisée.

3)- Corrélation.

IV- Exploitation.

1)- Caractéristique d’un générateur.

2)- Exemple d’ajustement se ramenant à un ajustement affine.

Exemple 1 :
Caractère aléatoire du phénomène de désintégration radioactive

Exemple 2 :
Mesure de la valeur d'une résistance. Dispersion des valeurs

 

 

I- Définitions.

-  On appelle x, le caractère étudié.

-  On appelle xi la valeur numérique du caractère étudié.

-  L’effectif, noté ni, est le nombre de mesures donnant le résultat xi.

-  La fréquence , ou n est le nombre total de mesures :

II- Les paramètres de position.

1)- La moyenne : moyenne pondérée, moyenne arithmétique.

-  On la note

-  Formule :

-  Cette moyenne est le paramètre de position le plus couramment utilisé et le plus rapide à calculer.

2)- Le mode :

-  C’est la valeur de x qui correspond à l’effectif maximum.

3)- La médiane :

-  Il y a autant de mesures supérieures que de mesures inférieures à cette valeur.

4)- Les paramètres de dispersion.

a)-  L’écart moyen. (écart arithmétique ou moyenne des écarts).

-  On peut calculer l’écart absolu d’une mesure : et faire la moyenne pondérée de ces écarts pour obtenir l’écart moyen que l’on note e.

-   

b)-  L’écart type. On utilise surtout en statistique l’écart type ou l’écart quadratique moyen, noté σ.

-  Le calcul de l’écart type découle de celui de la variance car l’écart type est égal à la racine carrée de la variance.

-   

-  La variance peut se calculer à partir de la formule de Kœnig :

-   

-  En conséquence :

c)-  L’intervalle interquartile.

-  Le premier quartile Q1 : il y a 25 % de mesures inférieures.

-  Le troisième quartile Q3 : il y a 25 % de mesures supérieures.

-  Le deuxième quartile Q2 : c’est la médiane.

-  Il y a  50 % de mesures dans l’intervalle interquartile [Q1, Q2].

xi

ni

 

996

1

997

3

998

8

999

10

1000

15

1001

19

1002

14

1003

10

1004

8

1005

5

1006

4

1007

2

1008

1

-  Effectif total : n = 100 ; Moyenne :  ; e ≈ 1,979 : σ ≈ 2,47 ;

d)-  Remarque :

-  ces trois paramètres de dispersion sont liés entre eux lorsque la distribution est normale ou lorsque la distribution est pratiquement normale.

-  σ ≈ 1,25 e

-  Dans cet exemple : σ ≈ 2,47 et σ ≈ 1,25 e Þ  σ ≈ 1,25 e

-   

-  Dans cet exemple : σ ≈ 2,47 ;

-  L’écart est important car il est difficile de déterminer les valeurs des différents quartiles.

5)- La Loi Normale.

-  On démontre en statistique que la distribution des mesures, lorsque le nombre de mesures augmente tend vers une distribution normale dite de Gauss – Laplace.

-  Le nombre de mesures doit être supérieur à 50.

-  La Loi Normale :

-  On démontre en probabilité que

-  Si représente la moyenne, σ  l‘écart-type et x une valeur incluse dans l'ensemble de données, alors

-  environ 68 % des données se situent à l'intérieur de l'intervalle :  .

-  environ 95 % des données se situent à l'intérieur de l'intervalle : .
 

-  Environ 99 % des données se situent à l'intérieur de l'intervalle : .

6)- Estimation.

-  Dans le cas d’une expérience de physique, on se heurte à des problèmes d’estimation.

-  Si l’on a une série de n mesures d’une grandeur x (résistance, nombre d’impulsions d’une source radioactive, …), on peut calculer :

-  La moyenne ,

-  L’écart type σ, de cette série de mesures.

-  Mais la valeur de la moyenne  ne représente qu’une estimation, une valeur approchée de la valeur réelle inconnue notée x.

-  On démontre que lorsque la distribution ressemble à une loi normale, la probabilité pour que x appartienne à l’intervalle de confiance ; est supérieure à 99 %.

-    ; h est la constante de Student. Elle est donnée par les tables de Student.

-  La grandeur ɛ est appelée incertitude, erreur standard ou écart probable.

n

h à 99 %

h à 95 %

51

2,678

2,009

61

2,660

2,000

81

2,639

1,990

101

2,626

1,984

201

2,601

1,972

501

2,586

1,965

1001

2,576

1,960

-  Dans l’exemple précédent : comme n = 100, h ≈ 2,626

-  Valeur de ɛ :

-  La probabilité pour que x Î ] 1000, 1002 [ est de 99 %.

III- Droite de régression.

1)- Situation expérimentale.

-  La tension UPN aux bornes d’un générateur qui débite dans un circuit  l’intensité I vérifie la loi théorique :

UPN = Er . I  {

E : f.e.m en volt (V)

r : résistance interne en ohm (Ω)  

 

-  Les valeurs expérimentales sont les suivantes :

I en A

0,15

0,26

0,38

0,52

0,72

0,92

1,00

U en V

3,82

3,59

3,33

3,10

2,77

2,41

2,19

-  En reportant les valeurs sur du papier millimétré, on constate que les points expérimentaux sont sensiblement alignés.

 

-  Pour que l’expérience permette de déterminer les grandeurs E et r, il faudrait connaître la droite qui s’ajuste le mieux aux données expérimentales.

-  On peut faire un ajustement graphique par tâtonnement (On dit alors que l’on trace la droite moyenne : méthode que l’on utilise en classe de seconde).

2)- Autre méthode utilisée.

-  Une autre méthode très utilisée, est la méthode des moindres carrés.

a)- Méthode des moindres carrés verticaux.

-  On cherche par le calcul, la droite telle que la somme des carrés des distances verticales entre les points et la droite soit minimale.

-  Exemple : On possède n points expérimentaux (x 1 ; y 1), (x 2 ; y 2), (x 3 ; y 3), ……(x n ; y n).

-  Dans notre exemple, les points expérimentaux sont sensiblement alignés.

- On cherche une droite D d’équation : y = a . x + b.

 

-  La droite D est telle que la somme S des carrés des écarts verticaux est minimale :

-  (1)

première étape : supposons que la valeur de a est fixée. En conséquence, la seule variable est b.

-  S est minimum si :  .

-  À l’aide de l’expression (1), on peut calculer la dérivée première de S par rapport à b :

-   

-  On peut calculer la dérivée seconde :

-   

 

-  En conséquence :

-  On est bien en présence d’un minimum.

 

-   

-  Or :

-  b = yMa . xM

-  Cela signifie que, parmi toutes les droites de coefficient directeur donné a, celui qui rend S minimum, est celle qui passe par le point moyen M de coordonnées (x M ; y M).

 Deuxième étape : On fait le changement de variable suivant :

- 

-  On se limite aux droites passant par le point M. Ces droites ont pour équation :

-  Y = a . X.

-   

-  S est minimum par rapport à la variable a si .

-   

-  On est bien en présence d’un minimum.

-  Détermination de l’expression de a :

-   

-  Expression qui permet le calcul de la valeur de a :

-  Or :

-   

-  à partir de la valeur de a, on peut en déduire celle de b grâce à l’expression :

-  b = yMa . xM

-  La droite obtenue d’équation : y = a . x + b est appelée droite de régression de y en x.

b)- Méthode des moindres carrés horizontaux.

-  On cherche par le calcul, la droite telle que la somme des carrés des distances horizontales entre les points et la droite soit minimale.

-  Exemple : On possède n points expérimentaux (x 1 ; y 1), (x 2 ; y 2), (x 3 ; y 3), ……(x n ; y n).

-  Dans notre exemple, les points expérimentaux sont sensiblement alignés.

- On cherche une droite D’ d’équation : y = a’ . x + b’.

 

 

-  La droite D’ est telle que la somme S des carrés des écarts horizontaux est minimale :

-  (1)

 première étape : supposons que la valeur de a’ est fixée. En conséquence, la seule variable est b’.

-  S est minimum si .

-  À l’aide de l’expression (1), on peut calculer la dérivée première de S par rapport à b :

-   

-  Puis la dérivée seconde par rapport à b’.

-  Il s’agit bien d’un minimum.

-  En conséquence, S est minimum si

-   

-  Or :

-  b’ = yMa’ . xM

-  Cela signifie que, parmi toutes les droites de coefficient directeur donné a’, celui qui rend S minimum, est celle qui passe par le point moyen M de coordonnées (xM ; yM).

 Deuxième étape : On fait le changement de variable suivant :

-   

-  On se limite aux droites passant par le point M. Ces droites ont pour équation :

-  Y = a . X.

-  On remplace b’ par son expression dans S.

-   

-  S est minimum par rapport à la variable a’ si .

-   

-  Détermination de l’expression de a’ :

-   

-  Expression qui permet le calcul de la valeur de a’ :

-  Or :

-   

-  à partir de la valeur de a’, on peut en déduire celle de b’ grâce à l’expression : b’ = yMa’ . xM

-  La droite obtenue d’équation : y = a’ . x + b est appelée droite de régression de x en y.

3)- Corrélation.

a)- Le coefficient de corrélation.

-  Le coefficient de corrélation linéaire r est défini par l’expression suivante :

-  Si | r | = 1 les deux droites D et D’ sont confondues. Tous les points du nuage de points sont alignés. Il y a corrélation linéaire.

-  Si r = 0 il n’y a pas de corrélation linéaire.

-  Si | r | ≈ 1 il y a dépendance linéaire statistique entre les variables x et y.

IV- Exploitation.

1)- Caractéristique d’un générateur.

-  La tension UPN aux bornes d’un générateur qui débite dans un circuit  l’intensité I vérifie la loi théorique :

UPN = Er . I  {

E : f.e.m en volt (V)

r : résistance interne en ohm (Ω)  

a)- Tableau de valeurs.

I en A

0,15

0,26

0,38

0,52

0,72

0,92

1

U en V

3,82

3,59

3,33

3,10

2,77

2,41

2,19

b)-  Exploitation.

-  Graphe : UPN = f (I).

 

-  Une calculatrice graphique ou un tableur permet de déterminer l’équation de la droite et de donner le coefficient de corrélation et le coefficient de détermination.

 

-  Il faut interpréter le résultat :

-  La force électromotrice du générateur est donnée par la valeur de l’ordonnée à l’origine E ≈ 4,08 V

-  La résistance interne du générateur est donnée par la valeur absolue du coefficient directeur de la droite D.

-  r ≈ 1,86 Ω.

-  Le coefficient de corrélation .

-  Il y a une dépendance linéaire entre les grandeurs UPN et I

-  Le résultat est en adéquation avec le modèle choisi :

-  UPN = -1,86 I + 4,08.

2)- Exemple d’ajustement se ramenant à un ajustement affine.

 Dans une substance radioactive, si N0 désigne le nombre de noyaux radioactifs au temps 0, le nombre N d’atomes radioactifs présents au temps t est donné par la relation :

-  N = N0 . e λ.t.

-  À partir de l’indium radioactif, on a obtenu les résultats suivants :

t

en min

0

5

10

15

20

25

30

35

40

N

98

92

87

80

73

70

67

63

60

-  On peut donner une autre formulation de la loi théorique pour ramener notre étude à celle d’une fonction affine.

-   

-  On détermine la valeur de λ à l’aide d’un ajustement linéaire à partir des valeurs de  et de x = t.

-  On calcule la droite de régression de y par rapport à x.

t en min

0

5

10

15

20

25

30

35

40

N

98

92

87

80

73

70

67

63

60

0

-0.0632

-0.1196

-0.2029

-0.2945

-0.3365

-0.3803

-0.4418

-0.4906

-  Représentation graphique  et exploitation.

 

-  avec λ ≈ 0,0125 min – 1.

-  Comme on s’est ramené à un ajustement affine en utilisant une fonction logarithmique, on dit que l’on a procédé à un ajustement logarithmique.

-  On peut retrouver la durée de demi-vie :  .