Ce système a une solution unique si et seulement si
.
On peut considérer que les données
constituent un
échantillon d'une v.a.
que l'on peut caractériser par sa
moyenne
et sa variance
estimées.
La condition d'existence d'une solution est donc
ce qui équivaut à dire qu'il faut simplement que les données
de l'échantillon ne soient pas toutes identiques. Le système peut
alors se réécrire sous la forme:
dont la solution analytique est:
Les v.a.
et
sont reliées par la relation
où
et
sont les valeurs vraies. On a vu dans ce cas que
et
.
On peut donc relier la valeur estimée
à la valeur vraie
par:
L'estimation sera donc parfaite si les v.a.
et
sont parfaitement
corrélées (i.e.
). Plus cette corrélation
sera faible, moins bonne sera l'estimation. Le coefficient de corrélation
est donc un bon indicateur de la qualité de la régression linéaire
simple. De même, pour le paramètre
, on sait que
. Donc,
Là encore, l'estimation sera d'autant meilleure que la corrélation sera proche
de 1. Cependant, on constate que
et
interviennent comme un
gain sur l'erreur due à la corrélation non parfaite. L'estimation de
sera donc plus vite dégradée que celle de
.