La maximisation de cette probabilité peut se réécrire sous
la forme d'une minimisation d'une fonction de coût
où
est le vecteur des paramètres du modèle / interprétation
.
Soit
. La minimisation de
conduit
à résoudre le système de
(nombre de paramètres) équations:
Ce système n'a bien sur pas de solution générale et il convient
de l'étudier en fonction du choix de
, ce qui donne une classe
d'estimateurs connus sous le nom de M-estimateurs.
Modèle de Legendre:
C'est le cas le plus connu car il correspond à l'hypothèse de
normalité de la distribution des écarts. On pose
et
L-estimateur:
Egalement très utilisé, cet estimateur utilise
et donc
ce qui conduit à l'estimateur médian.
Modèle de Cauchy / Lorentz:
Comme nous l'avons vu précédemment, ce modèle permet de par la plus lente décroissance de la loi de Cauchy, de mieux rendre compte des apparitions de données abérentes.
et
.
La système à résoudre
est alors non linéaire
et il faut avoir recours à des résolutions itératives.
Modèle de Huber:
Dans ce modèle, on utilise un seuil
qui permet d'avoir à la
fois une décroissance rapide (i.e. quadratique) si l'écart
est faible et de réduire la décroissance (donc augmenter
l'importance) des écarts forts (au delà du seuil). Il réalise
un bon compromis entre le modèle de Legendre et celui du L-estimateur.
Modèle de Tuckey:
Le modèle de Tuckey est du même type que celui de Hubert mais un
peu plus complexe car il permet de s'affranchir de la sensibilité au
choix du seuil
.
La valeur
est appelée point de rejet (rejection point)
et joue le rôle
du seuil de Hubert. La valeur
est la constante de confiance est
vaut
(cette valeur a été déterminée pour obtenir une
bonne adéquation à des écarts distribués normalement). La
valeur
est un facteur de dimension qui permet d'adapter le seuil
à l'étalement de la distribution des écarts. On peut assimiler
à un écart-type et utiliser l'estimateur correspondant mais
Tuckey propose un estimateur plus robuste, la médiane des écarts
absolus (Median of Absolute Deviation) qui vaut
On peut aussi déterminer le point de rejet en pourcentage du volume
de données. Par exemple, on ellimine les
% plus grandes
et plus petites valeurs des écarts. Une valeur généralement
recommandée est
. La médiane est le cas
extrème de cet estimateur tronqué avec
.
R-estimateur (Jaeckel, 1972):
Le R-estimateur est un cas particulier car il ne s'appuie plus sur
des relations linéaires mais tient compte essentiellement du
classement des écarts. La fonction de cout
est la suivante:
Les tests de Kolmogorov-Smirnov et de Spearman sont d'autres exemples de R-estimateurs.
Le modèle L.M.S. (Least Median of Squares,
Rousseeuw, 1984):
Le vecteur de paramètres
est la solution de
.
Si la robustesse de cet estimateur,
, est asymptotiquement
égale à
, sa complexité est relativement élevée
.