Biais d’un estimateur dit non biaisé

Le saviez-vous ?
La formule universellement utilisée pour calculer un écart-type d’échantillon, celle qu’on apprend à l’école, celle dont usent probabilistes, statisticiens, physiciens, sondeurs, traders et… métrologues, eh bien cette formule est biaisée !*

Petit rappel : L’écart-type d’une population finie et connue est donné par la racine de la moyenne des écarts à la moyenne :


Cependant, lorsque la population n’est pas entièrement connue (infinie ou trop importante pour en connaître tous les éléments), comme lors d’un mesurage, µ est inconnu de par l’échantillonnage réalisé. Bien que µ soit estimé sans biais par la moyenne arithmétique des éléments de l’échantillon X ̅, l’écart-type calculé comme ci-dessus est, lui, biaisé. On montre qu’un écart-type d’échantillon non biaisé est donné par la formule suivante (démonstration sur https://www.lametrologie.com/ressources/, partie « Théorie de l’estimation ») :

Parfait, sauf que cet écart-type expérimental est lui aussi biaisé, et le biais est d’autant plus important que le nombre de valeurs constituant l’échantillon est faible.
Prenez par exemple une variable aléatoire d’écart-type égal à 1. Tirez 3 valeurs de cette variable selon sa loi de distribution et vous obtiendrez en moyenne un écart-type inférieur au « 1 » attendu. Par exemple, l’écart-type expérimental de 3 valeurs distribuées selon une loi normale d’écart-type égal à 1 est en moyenne égal à 0,886. Pour vous en convaincre, testez vous-même ce biais en téléchargeant le fichier de simulation (format Excel xlsm) disponible sur le site https://www.lametrologie.com/statistiques/, partie « Un biais dans l’écart-type ! ».
Le NIST, dans son Engineering Statistics Handbook, a étudié ce phénomène et proposé un facteur de correction pour une variable aléatoire de distribution normale (décrit ici : http://www.itl.nist.gov/div898/handbook/pmc/section3/pmc32.htm):

Ce facteur est une constante qui dépend de la taille de l’échantillon, n. L’article explique que l’écart-type expérimental s estime c4.σ, c’est-à-dire qu’il faut diviser s par c4 pour estimer sans biais σ.
Le fichier proposé en téléchargement (https://www.lametrologie.com/statistiques/, partie « Un biais dans l’écart-type ! ») calcule aussi le facteur de correction expérimental et le compare au facteur c4 pour 5 valeurs successives de n.

* Voir sur le même sujet: « J.M. POU: Quelques considérations importantes… »

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée.