Nous aborderons dans ce chapitre la technique la plus classique qui réalise une régression linéaire incrémentale, le filtre de Kalman.
Soit
l'estimation initiale et son incertitude
(
, et
est une matrice
). De même,
soit
l'estimation courante (calculée grâce aux
premières données) et son incertitude. On suppose l'arrivée
d'une nouvelle donnée
(
) pour laquelle
on connait aussi son
incertitude notée
(
est une matrice
).
Le problème est donc le maintenant de trouver la nouvelle estimation
et son incertitude,
.
Le principe de cette mise à jour est traduit par la relation:
Comment cela s'interprète-t-il? La matrice
est une matrice
qui permet de passer de l'estimation
au
domaine des données. Le terme
est la prédiction
de la
ème donnée à partir de l'estimation calculée
sur les
premières. Le terme
traduit donc l'écart entre la prédiction et la donnée réelle.
On peut aussi dire que cet écart est l'innovation apportée par
la nouvelle donnée. Cette innovation va servir à mettre à jour
l'estimation. Cette mise à jour est une simple addition où l'on
fait cependant intervenir un gain sur la partie innovation, la
matrice
appelée gain de Kalman.
Le gain de Kalman doit tenir compte des incertitudes relatives de
l'estimation courante et de la donnée. Si l'incertitude de la
donnée
est négligeable devant celle du modèle
,
on devra avoir un gain fort, i.e. la donnée est fiable.
A l'inverse, si l'incertitude de la donnée est grande par
rapport à celle de l'estimation, le gain doit être très
faible, i.e. la donnée étant peu fiable, il est normal
qu'elle ne modifie pas ou peu l'estimation courante. Ces remarques se
traduisent par la relation suivante:
L'emploi de la matrice
est rendu nécessaire par le fait que les
matrices d'incertitudes ne sont pas de même rang.
Il ne reste plus qu'à mettre à jour l'incertitude de l'estimation qui tient compte de l'incertitude courante et du gain de Kalman par la relation:
Prenons un exemple simple,
et
. On obtient
les formules suivantes:
On peut montrer que l'estimation obtenue par ce processus après
données est égale à celle que l'on obtiendrait si l'on
estimait directement le vecteur
sur l'échantillon de
données.