fbpx

Calcul de valeur P: tester si une pièce est truquée avec Excel

Aujourd’hui nous allons voir comment tester si une pièce est truquée avec Excel. Pour cela nous allons réaliser plusieurs tirages et comparer les résultats obtenus à une valeur de test appelée en statistique valeur p.

Calcul des tirages

Nous allons volontairement travailler avec une pièce truquée. Pour réaliser des tirages avec une pièce truquée sous Excel, nous utiliserons la formule:

=ARRONDI(ALEA()+0,2;0)

Cela correspond à une valeur aléatoire entre 0 et 1, auquel on ajoute 0,2. Seules les valeurs aléatoires en dessous de 0,3 seront arrondies à 0 (30% des valeurs), le reste arrondi à 1 (60% des valeurs). 0 représentera face et 1 pile.

Nous allons commencer par faire 9 tirages de la pièce, nous obtenons 6 pile. L’intuition nous dit alors que cette pièce est truquée. Nous allons poser l’hypothèse:

Hypothèse: la pièce n’est pas truquée

Nous allons essayer de prouver que cette hypothèse est fausse.

Définition de la valeur p

Nous allons essayer de montrer que l’hypothèse est fausse. Pour cela, nous allons calculer la valeur p: Probabilité d’avoir un résultat aussi extrême si l’hypothèse est vraie. C’est aussi la probabilité de se tromper en disant que l’hypothèse est fausse.

En général on calcule la valeur p et on considère que l’hypothèse est fausse si p<5%: on a moins de 5% de chance d’avoir tort.

Calcul de la valeur p pour notre tirage

Dans notre exemple, nous avons 9 tirages de pièces, la probabilité d’obtenir 6 fois pile (ou plus) si l’hypothèse est vraie est régie par une loi binomiale à 9 degrés de libertés. On la calcule avec la formule:

p=1-LOI.BINOMIALE(Pile-1;Nombre de tirages;0,5;VRAI)

Explication: il s’agit de 1 moins la probabilité d’avoir 8 tirages piles ou moins, sachant que la probabilité est de 50% car la pièce n’est pas truquée selon l’hypothèse.

calcul d'une valeur p en statistique

Dans notre exemple, la valeur p est de 25%: on a 25% de chances de se tromper en disant que l’hypothèse est fausse. P est supérieure au seuil acceptable.

Conclusion: on ne peut rien dire!

Calcul de la valeur p sur un échantillon plus grand

Nous allons maintenant faire le même test mais sur un échantillon plus grand de 100 valeurs:

tst de la valeur p en statistique sur un échantillon plus grand

Cette fois ci, avec la même formule, on obtient une valeur p de 0,000235% ! On ne prend pas beaucoup de risque en affirmant que l’hypothèse est fausse.

On peut donc affirmer que la pièce est truquée, en ayant 0,000235% de chance de se tromper ce qui est inférieur à notre seuil.

On peut tracer le graphique de la valeur p en fonction de l’échantillon, en supposant qu’à chaque fois on a environ 70% de valeurs piles:

valeur p en fonction de la aille de l'échantillon

Le graphe est en dents de scie car pour de faibles échantillons, il est difficile de tomber exactement sur 70% de valeurs pile. Lorsque l’échantillon grandit, on voit en revanche qu’au dessus de 20 tirages, la valeur p tombe en dessous de notre seuil de 5%.

About Docteur Excel
Tu souffres sur Excel ? Ça se soigne ! Un traitement de choc pour tous tes problèmes de tableur! Docteur Excel t'apprends à manipuler Excel avec une précision chirurgicale pour gagner un temps fou, éblouir ton patron et devenir un pro du tableur.