Consideremos el caso en que tenemos dos poblaciones de modo que el carácter que estudiamos en ambas (X1 y X2) son v.a. distribuidas según leyes gaussianas
En cada una de estas poblaciones se extrae mediante muestreo aleatorio simple, muestras que no tienen por que ser necesariamente del mismo tamaño (respectivamente n1 y n2)
Podemos plantearnos a partir de las muestras el saber qué diferencias existen entre las medias de ambas poblaciones, o por ejemplo estudiar las relación existente entre sus dispersiones respectivas. A ello vamos a dedicar los siguientes puntos.
Supongamos que dos poblaciones tengan varianzas idénticas
(homocedasticidad),
.
Es decir
Por razones análogas a las expuestas en el caso de una población una población, se tiene que
Sea Z la v.a. definida como
El siguiente cociente se distribuye entonces como una
de Student con
n1+n2-2 grados de libertad
donde se ha definido a
como la
cuasivarianza muestral ponderada
de
y
Si
es el nivel de significación con el que deseamos
establecer el intervalo para la diferencia de las dos medias,
calculamos el valor
que deja por encima de si
de la masa de probabilidad
de
Tn1+n2-2
Repitiendo un proceso que ya hemos realizado en ocasiones anteriores,
tenemos una probabilidad de
de que a extraer una muestra
aleatoria simple ocurra:
Luego el intervalo de confianza al nivel
para la diferencia de esperanzas de dos poblaciones
con la misma varianza (aunque esta sea desconocida) es:
En ambos grupos los pesos de los recién nacidos provienen de sendas distribuciones normales de medias desconocidas, y con varianzas que si bien son desconocidas, podemos suponer que son las mismas. Calcular en cuanto influye el que la madre sea fumadora en el peso de su hijo.
Solución:
Si X1 es la v.a. que describe el peso de un niño que nace de madre no fumadora, y X2 el de un hijo de madre fumadora, se tiene por hipótesis que
Si queremos estimar en cuanto influye el que la madre sea fumadora en el
peso de su hijo, podemos estimar un intervalo de confianza para
,
lo que nos dará la diferencia de peso esperado entre un niño del
primer grupo y otro del segundo. El estadístico que se ha
de aplicar para esta cuestión es:
donde
Consideramos un nivel de significación que nos parezca aceptable,
por ejemplo
,
y el intervalo buscado se obtiene a partir de: (ver la Figura
8.9)
con lo cual se puede decir que un intervalo
de confianza para el peso esperado
en que supera un hijo de madre no fumadora al de otro de madre fumadora
está comprendido con un nivel de confianza del
entre los
0,068 Kg y los 0,731 Kg.