Plus exactement, soit
un paramètre inconnu
2intervenant dans la loi de probabilité d'une variable aléatoire
.
La loi de probabilité de cette variable aléatoire doit être connue
analytiquement (on choisit parmi les modèles existants la loi la plus
appropriée au phénomène observé). Seule la valeur numérique du
paramètre
intervenant dans cette loi de probabilité est
inconnue.
Soient
les
valeurs prises par
la v.a.
dans un échantillon de taille
prélevé dans la
population-mère.
On appelle estimateur de
, et l'on note
, la fonction
qui aux valeurs
de l'échantillon fait correspondre la valeur du
paramètre
. On note la valeur numérique de cette estimation
par
Par définition,
est une fonction des réalisations d'une v.a.,
est donc une v.a. dont on peut chercher à déterminer les
caractéristiques (loi, ddp, FR, moments, ...).
Exemple: On observe un phénomène de production
de pièces manufacturées. Chaque pièce est associée à une
mesure (un indicateur de qualité par exemple). Comme on ne peut
pas vérifier chaque mesure, on procède à un échantillonnage
qui nous fournit donc un échantillon. Supposons que la connaissance
de la nature de cet indicateur nous permet de faire l'hypothèse
qu'il obéit à une loi de probabilité normale. Le problème est
maintenant, au vue de l'échantillon
, de proposer une
valeur pour la moyenne de cette loi normale. Il faut procéder à
une estimation du paramètre vrai
qui se traduit par la valeur
. Il y a une infinité de manière possible parmi lesquelles
on peut citer
médiane
mode
Quel est le meilleur estimateur de la moyenne ? Existe-t-il ?
Sur ce simple exemple, est résumé le problème fondamental de l'estimation: quelle est la définition mathématique de meilleur?
La réponse est simple, il n'en existe pas. Alors comment comparer les estimateurs. Pour cela, on se sert de plusieurs critères, le plus souvent liés au bon sens:
le biais: On souhaite que l'estimation ne soit pas systématiquement décalée par rapport à la valeur vraie.
la précision: Si l'on répète l'estimation sur un autre échantillon, on souhaite obtenir une estimation cohérente, donc peu de variation d'un échantillon à l'autre. On parlera aussi d'efficacité.
la convergence: Si l'on peut estimer la valeur du paramètre sur toute la population-mère, la valeur de l'estimation obtenue doit être la valeur vraie du paramètre.
la compléxité: Toute estimation nécessite un
calcul donc un temps. On s'attachera donc à évaluer la complexité
du calcul en fonction de la taille des données (i.e.
).
la robustesse: Dans tout cas concrèt, il existe des sources de perturbations. On souhaite que l'estimation ne soit pas sensible à la présence de valeurs abérantes (outliers en anglais).
Ces différents critères ne sont pas forcément compatibles entre eux, et l'on retrouve des dilemmes classiques, précision vs robustesse, convergence vs complexité.