up
next previous
Nodo Raíz: 8.4 Intervalos de confianza para la
Siguiente: 8.6 Intervalos de confianza para variables
Previo: 8.4.8 Estimación del tamaño muestral

Subsecciones

   
8.4.10 Intervalos para la diferencia de medias de dos poblaciones

Consideremos el caso en que tenemos dos poblaciones de modo que el carácter que estudiamos en ambas (X1 y X2) son v.a. distribuidas según leyes gaussianas


\begin{eqnarray*}X_1& {\leadsto}&{ {{\bf N} \left( \mu_1,\sigma_1^2 \right)} }
\\
X_2&{\leadsto}&{ {{\bf N} \left( \mu_2,\sigma_2^2 \right)} }
\end{eqnarray*}


En cada una de estas poblaciones se extrae mediante muestreo aleatorio simple, muestras que no tienen por que ser necesariamente del mismo tamaño (respectivamente n1 y n2)


\begin{eqnarray*}\vec{X}_1 &{\equiv}& X_{11},X_{12},\dots,X_{1n_1}
\\
\vec{X}_2 &{\equiv}& X_{21},X_{22},\dots,X_{2n_2}
\end{eqnarray*}


Podemos plantearnos a partir de las muestras el saber qué diferencias existen entre las medias de ambas poblaciones, o por ejemplo estudiar las relación existente entre sus dispersiones respectivas. A ello vamos a dedicar los siguientes puntos.

   
8.4.10.1 Intervalo para la diferencia de medias homocedáticas

Supongamos que dos poblaciones tengan varianzas idénticas (homocedasticidad),$\sigma ^2$. Es decir


\begin{displaymath}\sigma^2=\sigma_1^2=\sigma_2^2.
\end{displaymath}

Por razones análogas a las expuestas en el caso de una población una población, se tiene que


\begin{displaymath}\left.
\begin{array}{l}
\chi_{n_1-1}^2 = \displaystyle \frac{...
...n_2-1}^2
\:{\leadsto}{ \mbox{\boldmath$\chi$ } }_{n_1+n_2-2}^2
\end{displaymath}

Sea Z la v.a. definida como

\begin{displaymath}Z=\frac{(\overline{X}_1-\overline{X}_2)-(\mu_1-\mu_2)}{
\sqrt...
...{1}{n_2}\right)}}
\:{\leadsto}{ {{\bf N} \left( 0,1 \right)} }
\end{displaymath}

El siguiente cociente se distribuye entonces como una ${ {{\bf t} } }$ de Student con n1+n2-2 grados de libertad

 \begin{displaymath}T_{n_1+n_2-2} =
\frac{Z}{\sqrt{\displaystyle \frac{1}{n_1+n_2...
...1}{n_1}+\frac{1}{n_2}}}
\:{\leadsto}{ {{\bf t} } }_{n_1+n_2-2}
\end{displaymath}

donde se ha definido a $\hat{\cal S}^2$ como la cuasivarianza muestral ponderada de ${\hat{\cal S}}_1^2$ y ${\hat{\cal S}}_2^2$


\begin{displaymath}{\hat{\cal S}^{2}}= \frac{(n_1-1){\hat{\cal S}}_1^2 +(n_2-1){\hat{\cal S}}_2^2
}{n_1+n_2-2}
\end{displaymath}

Si $1-\alpha $ es el nivel de significación con el que deseamos establecer el intervalo para la diferencia de las dos medias, calculamos el valor $t_{n_1+n_2-1, 1-\alpha/2}$que deja por encima de si $\alpha/2$ de la masa de probabilidad de Tn1+n2-2


\begin{displaymath}{{\cal P}}[T_{n_1+n_2-2}>t_{n_1+n_2-2, 1-\alpha/2}]= \frac{\a...
...n_1+n_2-2} \right\vert \leq t_{n_1+n_2-2,1-\alpha/2}]=1-\alpha
\end{displaymath}

Repitiendo un proceso que ya hemos realizado en ocasiones anteriores, tenemos una probabilidad de $1-\alpha $ de que a extraer una muestra aleatoria simple ocurra:


\begin{eqnarray*}\left\vert
T_{n_1+n_2-2}
\right\vert
\leq t_{n_1+n_2-2,1-\alp...
...pha/2} \cdot
{\hat{\cal S}}\, \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}
\end{eqnarray*}


Luego el intervalo de confianza al nivel $1-\alpha $para la diferencia de esperanzas de dos poblaciones con la misma varianza (aunque esta sea desconocida) es:

$\displaystyle
\mu_1-\mu_2 =
(\overline{X}_1-\overline{X}_2) \pm t_{n_1+n_2-2,1-\alpha/2} \cdot
{\hat{\cal S}}\, \sqrt{\frac{1}{n_1}+\frac{1}{n_2}}
$

8.4.10.2 Ejemplo

Queremos estudiar la influencia que puede tener el tabaco con el peso de los niños al nacer. Para ello se consideran dos grupos de mujeres embarazadas (unas que fuman un paquete al día y otras que no) y se obtienen los siguientes datos sobre el peso X, de sus hijos:


\begin{displaymath}\left\{
\begin{array}{lll}
\mbox{Madres fumadoras}&\rightarro...
...x}_2=3,2 \:Kg\:\:\:{\hat{\cal S}}_2=0,8\:Kg
\end{array}\right.
\end{displaymath}

En ambos grupos los pesos de los recién nacidos provienen de sendas distribuciones normales de medias desconocidas, y con varianzas que si bien son desconocidas, podemos suponer que son las mismas. Calcular en cuanto influye el que la madre sea fumadora en el peso de su hijo.

Solución:

Si X1 es la v.a. que describe el peso de un niño que nace de madre no fumadora, y X2 el de un hijo de madre fumadora, se tiene por hipótesis que


\begin{displaymath}\exists \:\mu_1,\mu_2,\sigma^2, \mbox{ tales que }
\left\{
\b...
...{ {{\bf N} \left( \mu_2,\sigma^2 \right)} }
\end{array}\right.
\end{displaymath}

Si queremos estimar en cuanto influye el que la madre sea fumadora en el peso de su hijo, podemos estimar un intervalo de confianza para $\mu_1-\mu_2$, lo que nos dará la diferencia de peso esperado entre un niño del primer grupo y otro del segundo. El estadístico que se ha de aplicar para esta cuestión es:


\begin{displaymath}\frac{(\overline{x}_1-\overline{x}_2)-(\mu_1-\mu_2)
}{
{\hat{...
...} } }_{n_1+n_2-2}={ {{\bf t} } }_{35+27-2}={ {{\bf t} } }_{60}
\end{displaymath}

donde


\begin{displaymath}{\hat{\cal S}^{2}}= \frac{(n_1-1){\hat{\cal S}}_1^2 +(n_2-1){...
...6\cdot 0,8^2}{60}=0,419
\Longrightarrow
{\hat{\cal S}}=0,6473
\end{displaymath}

Consideramos un nivel de significación que nos parezca aceptable, por ejemplo $\alpha=0,05$, y el intervalo buscado se obtiene a partir de: (ver la Figura 8.9)


  
Figura: Región que se utiliza para calcular el intervalo de confianza.
\includegraphics[angle=-90, width=0.6\textwidth]{f8-8b.epsi}


\begin{displaymath}\frac{\mid \overbrace{(3,6-3,2)}^{0,4}-(\mu_1-\mu_2)\mid
}{
...
...frac{1}{27}}}_{0,1658}}
\leq t_{60;1-0,05/2} = t_{60;0,975}=2
\end{displaymath}


\begin{displaymath}\Longrightarrow
\mu_1-\mu_2= 0,4
\pm 2\cdot 0,1658\Longrightarrow \mu_1-\mu_2= 0,4\pm 0,3316
\end{displaymath}

con lo cual se puede decir que un intervalo de confianza para el peso esperado en que supera un hijo de madre no fumadora al de otro de madre fumadora está comprendido con un nivel de confianza del $95\%$ entre los 0,068 Kg y los 0,731 Kg.


next up previous
Nodo Raíz: 8.4 Intervalos de confianza para la
Siguiente: 8.6 Intervalos de confianza para variables
Previo: 8.4.8 Estimación del tamaño muestral

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo