up
next previous
Nodo Raíz: 8.6 Intervalos de confianza para variables
Siguiente: 8.6.4 Elección del tamaño muestral para
Previo: 8.6 Intervalos de confianza para variables

Subsecciones

   
8.6.2 Intervalo para una proporción

Sean $X_1,\dots,X_n{\leadsto}{ {{\bf Ber} \left( p \right)} }$. Si queremos estimar el parámetro p, la manera más natural de hacerlo consiste en definir la suma de estas --lo que nos proporciona una distribución Binomial (página [*]):

\begin{displaymath}X=X_1+\cdots+X_n {\leadsto}{ {{\bf B} \left( n,p \right)} }
\end{displaymath}

y tomar como estimador suyo la v.a.

\begin{displaymath}\hat{p} = \frac{X}{n}.
\end{displaymath}

Es decir, tomamos como estimación de p la proporción de éxitos obtenidos en las n pruebas8.1, $\hat{p}$.

La distribución del número de éxitos es binomial, y puede ser aproximada a la normal cuando el tamaño de la muestra n es grande, y p no es una cantidad muy cercana a cero o uno:


\begin{displaymath}X{\leadsto}{ {{\bf B} \left( n,p \right)} } \:\Rightarrow\:X{...
...ckrel{\approx}{\leadsto}\:}{ {{\bf N} \left( np,npq \right)} }
\end{displaymath}

El estimador $\hat{p}$ no es más que un cambio de escala de X, por tanto


\begin{displaymath}\hat{p}=\frac{X}{n} {\: \stackrel{\approx}{\leadsto}\:}{ {{\b...
...q}{n}}}
\approx Z \:{\leadsto}{ {{\bf N} \left( 0,1 \right)} }
\end{displaymath}

Esta expresión presenta dificultades para el cálculo, siendo más cómodo sustituirla por la siguiente aproximación:

$\displaystyle
\frac{\hat{p} - p}{\sqrt{\displaystyle \frac{\hat{p}\hat{q}}{n}}}
\approx Z \:{\leadsto}{ {{\bf N} \left( 0,1 \right)} }
$

Para encontrar el intervalo de confianza al nivel de significación $\alpha $ para p se considera el intervalo que hace que la distribución de $Z{\leadsto}{ {{\bf N} \left( 0,1 \right)} }$deje la probabilidad $\alpha $ fuera del mismo. Es decir, se considera el intervalo cuyos extremos son los cuantiles $\alpha/2$ y $1-\alpha/2$. Así se puede afirmar con una confianza de $1-\alpha $ que:


\begin{eqnarray*}\underbrace{z_{\alpha/2}}_{-z_{1-\alpha/2}} \leq Z \leq z_{1-\a...
...q z_{1-\alpha/2}\,
\sqrt{\displaystyle \frac{\hat{p}\hat{q}}{n}}
\end{eqnarray*}


Esto se resume en la siguiente expresión:

$\displaystyle p=\hat{p} \pm z_{1-\alpha/2}\,
\sqrt{\displaystyle \frac{\hat{p}\hat{q}}{n}}
$ con una confianza de $1-\alpha $


  
Figura: Intervalo de confianza para una proporción.
\includegraphics[angle=-90, width=0.8\textwidth]{f8-9.epsi}

8.6.2.1 Ejemplo

 Se quiere estimar el resultado de un referéndum mediante un sondeo. Para ello se realiza un muestreo aleatorio simple con n=100 personas y se obtienen 35% que votarán a favor y 65% que votarán en contra (suponemos que no hay indecisos para simplificar el problema a una variable dicotómica). Con un nivel de significación del 5%, calcule un intervalo de confianza para el verdadero resultado de las elecciones.

Solución: Dada una persona cualquiera (i) de la población, el resultado de su voto es una variable dicotómica:

\begin{displaymath}X_i{\leadsto}{ {{\bf Ber} \left( p \right)} }
\end{displaymath}

El parámetro a estimar en un intervalo de confianza con $\alpha=0,05$ es p, y tenemos sobre una muestra de tamaño n=100, la siguiente estimación puntual de p:

\begin{displaymath}\hat{p}=\frac{35}{100}=0,35\Longrightarrow \hat{q}=0,65
\end{displaymath}

Sabemos que

\begin{displaymath}\frac{\hat{p} - p}{\sqrt{\displaystyle \frac{pq}{n}}}
{\: \stackrel{\approx}{\leadsto}\:}{ {{\bf N} \left( 0,1 \right)} }
\end{displaymath}

En la práctica el error que se comete no es muy grande si tomamos algo más simple como

\begin{displaymath}Z=\frac{\hat{p} - p}{\sqrt{\displaystyle \frac{\hat{p}\hat{q}...
...stackrel{\approx}{\leadsto}\:}{ {{\bf N} \left( 0,1 \right)} }
\end{displaymath}

Así el intervalo de confianza buscado lo calculamos como se indica en la Figura 8.11:


\begin{eqnarray*}\left\vert Z \right\vert \leq z_{1-\alpha/2} &\Longleftrightarr...
...
\leq z_{0,975}=1,96
\\
&\Longleftrightarrow& p=0,35 \pm 0,0935
\end{eqnarray*}


Por tanto, tenemos con esa muestra un error aproximado de 9,3 puntos al nivel de confianza del 95%.


  
Figura: Región a partir de la cual se realiza una estimación confidencial para una proporción, con una confianza del 95%.
\includegraphics[angle=-90, width=0.6\textwidth]{f8-9b.epsi}


next up previous
Nodo Raíz: 8.6 Intervalos de confianza para variables
Siguiente: 8.6.4 Elección del tamaño muestral para
Previo: 8.6 Intervalos de confianza para variables

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo