next up previous contents
Next: Estimation d'une moyenne Up: Estimation par intervalle de Previous: Estimation par intervalle de   Contents

Estimation d'une proportion

Soit une population dont les individus possèdent un caractère $A$ avec une probabilité $p$ (loi 0/1). On cherche à déterminer cette probabilité inconnue en prélevant un échantillon de taille $n$ dans cette population. On constate que $x$ parmi les $n$ individus possèdent le caractère $A$. Que peut-on en déduire, i.e. la proportion $f_n = \frac{x}{n}$ approxime la valeur vraie $p$, mais avec quelle confiance.

Soit $F_n = \frac{x}{n}$; $F_n$ est une v.a. construite par la somme de $n$ variables aléatoires 0/1 et de même paramètre, $p$. C'est donc, d'après le théorème central limite, une variable aléatoire dont la loi de probabilité tend vers une loi normale de moyenne $p$ et d'écart-type $\sqrt{\frac{p(1-p)}{n}}$. Cette approximation est valable uniquement si la taille de l'échantillon est suffisamment grande (i.e. $n > 30$ en pratique).

Construisons l'intervalle de confiance autour de $p$ sous la forme:

\begin{displaymath}P(\vert f_n - p\vert < t) = 1 - \alpha \end{displaymath}

$\alpha$ est le risque (a priori, on construit un intervalle symétrique). $f_n$ est une réalisation d'une v.a. ${\cal N}(p,\sqrt{\frac{p(1-p)}{n}})$. donc on peut par normalisation et centrage obtenir une nouvelle v.a. $U$

\begin{displaymath}u = \frac{f_n-p}{\sqrt{\frac{p(1-p)}{n}}}~: {\cal N}(0,1) \end{displaymath}

On en déduit donc l'intervalle de confiance sous la forme:

\begin{displaymath}P[ a < \theta < b ] = P\left[~f_n - u \sqrt{\frac{p(1-p)}{n}} < p <
f_n + u \sqrt{\frac{p(1-p)}{n}}~\right] = 1 - \alpha \end{displaymath}

La valeur $t = u \sqrt{\frac{p(1-p)}{n}}$ est donc un résultat de calcul. La valeur de $u$ sera lue sur une table de loi normale ${\cal N}(0,1)$. Il existe par ailleurs différentes manières pour approximer la valeur de $p$:

$\bullet$ soit par la proportion $f_n$:

\begin{displaymath}P[ a < \theta < b ] = P\left[~f_n - u \sqrt{\frac{f_n(1-f_n)}...
... p <
f_n + u \sqrt{\frac{f_n(1-f_n)}{n}}~\right] = 1 - \alpha \end{displaymath}

$\bullet$ soit par majoration: en effet, quelle que soit la valeur de $p$, le produit $p(1-p)$ est majoré par $\frac{1}{4}$.


\begin{displaymath}P[ a < \theta < b ] = P\left[~f_n - \frac{u}{2\sqrt{n}} < p <
f_n + \frac{u}{2\sqrt{n}}~\right] \ge 1 - \alpha \end{displaymath}

Exemple: Soit un échantillon de taille $n=100$ et une proportion estimée $f_n = 0.6$. Quelle est la confiance dans cette valeur ou bien quel intervalle donne une confiance de $0.9$ (risque de $10\%$?


\begin{displaymath}t~: P(0.6-u\sqrt{\frac{0.6 \times 0.4}{100}} < p < 0.6 + u\sq...
...{0.6 \times 0.4}{100}}) = P(-t < \frac{p-0.6}{0.049} < t) = 0.9\end{displaymath}

Par lecture dans la table de la loi normale, on obtient $P(X<u)=0.95
\rightarrow u=1.645$. L'intervalle à $90\%$ de confiance autour de la proportion estimée est donc $[0.5194;0.6808]$.

$\diamondsuit$


next up previous contents
Next: Estimation d'une moyenne Up: Estimation par intervalle de Previous: Estimation par intervalle de   Contents
Jean-Michel Jolion 2006-05-27