up
next previous
Nodo Raíz: 10.6 Contraste de bondad de ajuste
Siguiente: 10.8 Problemas
Previo: 10.6.2 Distribuciones de parámetros conocidos

Subsecciones

10.6.4 Distribuciones con parámetros desconocidos

Supongamos que la distribución de X que queremos contrastar no especifica ciertos valores de r parámetros


\begin{displaymath}X{\leadsto}{ {{\bf Fam} \left( \theta_1,\dots,\theta_r \right...
...{\cal P}}[X=k]=p_k(\theta_1,\dots,\theta_r)
\end{array}\right.
\end{displaymath}

Estimemoslos a partir de la muestra, y consideremos las cantidades

\begin{displaymath}p_i=p_i(\hat{\theta}_1,\dots,\hat{\theta}_r)
\end{displaymath}

Entonces el contraste consiste en


\begin{displaymath}\left\{
\begin{array}{l} \displaystyle
\chi_{exp}^2 = \sum_{...
...^2 > \chi_{teo}^2 \mbox{ se rechaza $H_0$ }
\end{array}\right.
\end{displaymath}

10.6.4.1 Contraste de una distribución binomial

Queremos contrastar


\begin{displaymath}\left\{
\begin{array}{l}
H_0\: : \: \mbox{$X{\leadsto}{ {{\bf...
...
\\
H_1\: : \: \mbox{Lo anterior es falso}
\end{array}\right.
\end{displaymath}

Las cantidades pi son desconocidas, aunque tienen una forma en la que sólo dependen del único parámetro que debe ser estimado a partir de la muestra (r=1): Realizando esta estimación


\begin{displaymath}\hat{p} = \frac{1}{n\,k}\sum_{i=1}^k i\,{\cal O}_i
\end{displaymath}

tenemos todas las cantidades pi,


\begin{displaymath}p_i={ \left(\begin{array}{c} k\\ i \end{array}\right)\,} \hat{p}^i \hat{q}^{k-i}
\end{displaymath}

y la distribución del estadístico $\chi ^2$ es aproximadamente ${ \mbox{\boldmath$\chi$ } }_{k-2}^2$.

10.6.4.2 Contraste de una distribución normal

Si queremos contrastar si una v.a. X se distribuye normalmente


\begin{displaymath}\left\{
\begin{array}{l}
H_0\: : \: \mbox{$X{\leadsto}{ {{\bf...
...\
H_1\: : \: \mbox{$X$\space no es normal}
\end{array}\right.
\end{displaymath}

podemos realizar el contraste correspondiente mediante la técnica del estadístico $\chi ^2$tomando una muestra, estimando los parámetros mediante $\overline {x}$ y ${{\cal S}^{2}}$, y agrupando las observaciones (continuas) en un número finito, k, de intervalos. No rechazaremos entonces la normalidad de X si las probabilidades esperadas de los intervalos no son muy diferentes de las obtenidas sobre la muestra, es decir,

         
Intervalo ${\cal O}_i$ $p_i={{\cal P}}\left[{e_{i-1}\leq X\leq e_i}_{
\mid X{\leadsto}{ {{\bf N} \left( \overline{x},{{\cal S}^{2}} \right)} }}\right]$ ${\cal E}_i = n\cdot p_i$ $\frac{({\cal O}_i-{\cal E}_i)^2}{E_i}$
         
$-\infty$ - e1 ${\cal O}_1$ $p_1={{\cal P}}[{ X\leq e_1}]$ ${\cal E}_1=n\cdot p_1$ $\frac{({\cal O}_1-{\cal E}_1)^2}{E_1}$
         
e1 - e2 ${\cal O}_2$ $p_2={{\cal P}}[{e_1\leq X\leq e_2}]$ ${\cal E}_2=n\cdot p_2$ $\frac{({\cal O}_2-{\cal E}_2)^2}{E_2}$
         
e2 - e3 ${\cal O}_3$ $p_3={{\cal P}}[{e_2\leq X\leq e_3}]$ ${\cal E}_3=n\cdot p_3$ $\frac{({\cal O}_3-{\cal E}_3)^2}{E_3}$
         
... ... ... ... ...
         
ek-1 - $+\infty$ ${\cal O}_k$ $p_k={{\cal P}}[{e_{k-1}\leq X}]$ $E_k=n\cdot p_k$ $\frac{({\cal O}_k-{\cal E}_k)^2}{{\cal E}_k}$
  n 1 n $\chi_{exp}^2$

Entonces

\begin{displaymath}\left\{
\begin{array}{l} \displaystyle
\chi_{exp}^2 = \sum_{...
...^2 > \chi_{teo}^2 \mbox{ se rechaza $H_0$ }
\end{array}\right.
\end{displaymath}

10.6.4.3 Ejemplo

En un grupo de n=70 varones, se ha calculado su peso y se han observado las siguientes cantidades:

Peso M. clase Frecuencias
55 - 60 57,5 5
60 - 65 62,5 10
65 - 70 67,5 15
70 - 75 72,5 17
75 - 80 77,5 12
80 - 85 82,5 8
85 - 95 90 3

¿Se ajustan estos datos a una distribución normal?

Solución:

Definimos la v.a. X como el peso de un individuo elegido al azar de la población de varones. El test a realizar se escribe entonces como:


\begin{displaymath}\left\{
\begin{array}{l}
H_0\: : \: \mbox{$X{\leadsto}{ {{\bf...
...\
H_1\: : \: \mbox{$X$\space no es normal}
\end{array}\right.
\end{displaymath}

En primer lugar, vamos a unir el último intervalo con el primero, para asegurarnos de que cada intervalo contenga por lo menos 5observaciones:

Peso M. clase Frecuencias
55 - 60 57,5 5
60 - 65 62,5 10
65 - 70 67,5 15
70 - 75 72,5 17
75 - 80 77,5 12
80 - 95 87,5 11
  n=70

Posteriormente estimamos los parámetros desconocidos, suponiendo que realmente los datos provienen de una distribución normal. Para $\mu $, su estimador puntual máximo verosímil es $\overline {x}$. Para $\sigma ^2$ es ${{\cal S}^{2}}$, pero también es posible utilizar $\hat{\cal S}^2$. Así:


\begin{eqnarray*}\hat{\mu} &=& \overline{x}= 72,14
\\
\hat{\sigma}^2 &=& {\hat{\cal S}^{2}}= 76,39
\end{eqnarray*}


La diferencia entre el histograma de frecuencias relativas y la función de densidad de la distribución ${ {{\bf N} \left( \hat{\mu},\hat{\sigma}^2 \right)} }$ está representada en la figura 10.4.


  
Figura: Histograma de frecuencias absolutas y función de densidad gaussiana (cambiada de escala) más próxima al mismo, en el sentido de que sus parámetros han sido calculados a partir del histograma.
\includegraphics[angle=0, width=0.9\textwidth]{f10-4.epsi}

Posteriormente escribimos la tabla con los valores observados y los valores esperados de suponer cierta H0:

Peso ${\cal O}_i$ ${\cal E}_i$ ${\cal O}_I^2/{\cal E}_i$
ai - bi ni $n \cdot {{\cal P}}[a_i \leq X \leq b_i]$  
$-\infty$ - 60 5 5,761 4,3395
60 - 65 10 8,729 11,456
65 - 70 15 13,874 16,2174
70 - 75 17 15,687 18,4229
75 - 80 12 13,062 11,0243
80 - $+\infty$ 11 12,887 9,3893
  n=70 n=70 70,849

donde

\begin{displaymath}X{\leadsto}{ {{\bf N} \left(
\hat{\mu} = 72,14,
\hat{\sigma}^2 = 76,39 \right)} }
\;\;\Rightarrow
\end{displaymath}


\begin{displaymath}\Rightarrow\;\;
{{\cal P}}[\leq a_i \leq X\leq b_i]
= {{\cal ...
...c{b_i-72,14}{8,74}]-
{{\cal P}}[\frac{a_i-72,14}{8,74} \leq Z]
\end{displaymath}

y $Z{\leadsto}{ {{\bf N} \left( 0,1 \right)} }$.

Bajo la hipótesis H0 se tiene que el estadístico $\chi_{exp}^2 {\leadsto}{ \mbox{\boldmath$\chi$ } }_{6-3}^2={ \mbox{\boldmath$\chi$ } }_{3}^2$. Consideramos un nivel de significación $\alpha=0,05$. Como

\begin{eqnarray*}\chi_{exp}^2 & = & \sum_{i=1}^6 \frac{{\cal O}_i^2}{{\cal E}_i}...
...
70,849 - 70 = 0,849
\\
\chi_{teo}^2 &=& \chi_{3;0,95}^2 = 7,81
\end{eqnarray*}


entonces $\chi_{exp}^2<\chi_{teo}^2$, luego no se puede rechazar a la vista de los datos, el que estos provengan de una población normal.


next up previous
Nodo Raíz: 10.6 Contraste de bondad de ajuste
Siguiente: 10.8 Problemas
Previo: 10.6.2 Distribuciones de parámetros conocidos

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo