next up previous contents
Next: Filtre de Kalman Up: Régression linéaire Previous: Le cas de la   Contents

Intervalle de confiance sur le coefficient de corrélation

On peut déterminer un intervalle de confiance sur le coefficient de corrélation $r$ (afin de quantifier la qualité de la régression) grâce à l'introduction de la transformation $z_r$ donnée par :


\begin{displaymath}
z_r = \frac{1}{2} \log \left( \frac{1+r}{1-r} \right)
\end{displaymath}

et

\begin{displaymath}
r = \frac{e^{2z_r} - 1}{e^{2z_r} + 1}
\end{displaymath}

L'intervalle de confiance est défini par


\begin{displaymath}
1 - \alpha = \mbox{confiance} = P \left( z_r - z_{\alpha/2}\...
.../2}\sqrt{\frac{1}{n-3}} \right) = P( z_{inf} < \xi < z_{sup} )
\end{displaymath}

avec $P(Y < z_{\alpha/2}) = 1 - \alpha/2$$Y$ est une loi normale centrée réduite.

Grâce à la relation liant les variables $z$ et $r$, on peut obtenir l'intervalle de confiance sur $r$.

Exemple : Soit $r=0.54$ obtenu sur un échantillon de taille $n=69$. On souhaite construire l'intervalle de confiance à $99\%$ autour de cette valeur.

On obtient successivement $z_r = 0.604$. Dans la table de la loi normale, on lit $z_{0.995} = 2.575$ et donc $P(0.293 < \xi < 0.927) = 0.99$. Par inversion, on obtient l'intervalle de confiance sur l'estimation du coefficient de corrélation : $P(0.285 < \rho < 0.729) = 0.99$.



Jean-Michel Jolion 2006-05-27