up
next previous
Nodo Raíz: 7.4 Técnicas de muestreo sobre una
Siguiente: 7.4.4 Muestreo aleatorio estratificado
Previo: 7.4 Técnicas de muestreo sobre una

Subsecciones

  
7.4.2 Muestreo aleatorio

Consideremos una población finita, de la que deseamos extraer una muestra. Cuando el proceso de extracción es tal que garantiza a cada uno de los elementos de la población la misma oportunidad de ser incluidos en dicha muestra, denominamos al proceso de selección muestreo aleatorio.

El muestreo aleatorio se puede plantear bajo dos puntos de vista:

  
7.4.2.1 Muestreo aleatorio sin reposición

Consideremos una población E formada por N elementos. Si observamos un elemento particular, $e\in E$, en un muestreo aleatorio sin reposición se da la siguiente circunstancia:

Si consideramos una muestra de $n\leq N$ elementos, donde el orden en la elección de los mismos tiene importancia, la probabilidad de elección de una muestra $M=\left( e_1, e_2, \dots, e_n \right)$ cualquiera es

\begin{eqnarray*}{{\cal P}}[M] &=& {{\cal P}}[\left( e_1, e_2, \dots, e_n \right...
...N-(n-1)}
\\
&=& \frac{(N-n)!}{N!}
\\
& = & \frac{1}{V_{N,n}}
\end{eqnarray*}


lo que corresponde en el sentido de la definición de probabilidad de Laplace a un caso posible entre las VN,n posibles n-uplas de N elementos de la población.

Si el orden no interviene, la probabilidad de que una muestra


\begin{displaymath}M=\left\{ e_1, e_2, \dots, e_n \right\}\subset E
\end{displaymath}

sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-uplas, tantas veces como permutaciones en el orden de sus elementos sea posible, es decir


\begin{eqnarray*}{{\cal P}}[M] &=& {{\cal P}}[\left\{ e_1, e_2, \dots, e_n \righ...
...]
\\
& = & \frac{n! \cdot (N-n)!}{N!}
\\
& = & \frac{1}{C_n^N}
\end{eqnarray*}


  
7.4.2.2 Muestreo aleatorio con reposición

Sobre una población E de tamaño N podemos realizar extracciones de n elementos, pero de modo que cada vez el elemento extraído es repuesto al total de la población. De esta forma un elemento puede ser extraído varias veces. Si el orden en la extracción de la muestra interviene, la probabilidad de una cualquiera de ellas, formada por n elementos es:


\begin{displaymath}\frac{1}{N} \cdot \frac{1}{N} \cdots \frac{1}{N} = \frac{1}{N^n}
= \frac{1}{V\! R_{N,n}}
\end{displaymath}

Si el orden no interviene, la probabilidad de una muestra cualquiera, será la suma de la anterior, repitiéndola tantas veces como manera de combinar sus elementos sea posible. Es decir,

  $\mbox{$\bullet$}$
sea n1 el número de veces que se repite cierto elemento e1 en la muestra;
  $\mbox{$\bullet$}$
sea n2 el número de veces que se repite cierto elemento e2;
$\dots$
  $\mbox{$\bullet$}$
sea nk el número de veces que se repite cierto elemento ek,

de modo que $n=n_1+\cdots+n_k$. Entonces la probabilidad de obtener la muestra


\begin{displaymath}\overbrace{
\underbrace{e_1,\dots,e_1}_{n_1},
\underbrace{e_1...
...,
\dots,
\underbrace{e_k,\dots,e_k}_{n_k}
}^{n=n_1+\cdots n_k}
\end{displaymath}

es


\begin{displaymath}\begin{array}{c}
\mbox{probabilidad de una}
\\
\mbox{muestra...
...\
\mbox{las $n_k$\space observ.}
\\
\mbox{$e_k$ }
\end{array}\end{displaymath}

es decir,

\begin{displaymath}\frac{1}{N^n} \cdot k! \cdot n_1! \cdots n_k! =
\frac{1}{C\! R_{n_1,n_2,\dots,n_k}^N}
\end{displaymath}

El muestreo aleatorio con reposición es también denominado muestreo aleatorio simple, que como hemos mencionado se caracteriza por que

Sea X una v.a. definida sobre la población E, y f(x) su ley de probabilidad.


\begin{displaymath}E \longrightarrow n \mbox{ exp. aleatorios} \longrightarrow
\...
...) =
f({x_n}_{\mid x_1,x_2,\dots, x_{n-1}})
\end{array}\right.
\end{displaymath}

En una muestra aleatoria simple, cada observación tiene la distribución de probabilidad de la población:  \begin{displaymath}f_1 = f_2 = \cdots = f_n = f
\end{displaymath}
Además todos las observaciones de la v.a. son independientes, es decir  \begin{displaymath}f(x_1,x_2,\dots,x_n) = f(x_1) \cdot f(x_2) \cdot f(x_n)
\end{displaymath}
Las relaciones(7.1)-(7.2) caracterizan a las muestras aleatorias simples.

La selección de una muestra aleatoria puede realizarse con la ayuda de #.#>

7.4.2.3 Tablas de números aleatorios: Lotería Nacional

Un ejemplo de una tabla de números aleatorios consiste en la lista de los números de Lotería Nacional premiados a lo largo de su historia, pues se caracterizan por que cada dígito tiene la misma probabilidad de ser elegido, y su elección es independiente de las demás extracciones.

Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de números aleatorios de k=5 cifras (00000-99.999), una población de N=600individuos, y deseamos extraer una muestra de n=6 de ellos. En este caso ordenamos a toda la población (usando cualquier criterio) de modo que a cada uno de sus elementos le corresponda un número del 1 al 600. En segundo lugar nos dirigimos a la tabla de números aleatorios, y comenzando en cualquier punto extraemos un número t, y tomamos como primer elemento de la muestra al elemento de la población:


\begin{displaymath}1+\left[\frac{ t\cdot N}{10^k}\right] =
1+\left[\frac{ t\cdot 600}{100.000}\right]
\end{displaymath}

El proceso se repite tomando los siguientes números de la tabla de números aleatorios, hasta obtener la muestra de 10 individuos.

Las cantidades


\begin{displaymath}u=\frac{t}{10^k}
\end{displaymath}

pueden ser consideradas como observaciones de una v.a. U, que sigue una distribución uniforme en el intervalo [0,1]


\begin{displaymath}U{\leadsto}{ {{\bf U} \left( 0,1 \right)} }
\end{displaymath}

   
7.4.2.4 Método de Montecarlo

El método de Montecarlo es una técnica para obtener muestras aleatorias simples de una v.a. X, de la que conocemos su ley de probabilidad (a partir de su función de distribución F). Con este método, el modo de elegir aleatoriamente un valor de X siguiendo usando su ley de probabilidad es:

1.
Usando una tabla de números aleatorios7.1 se toma un valor u de una v.a. $U{\leadsto}{ {{\bf U} \left( 0,1 \right)} }$.
2.
Si X es continua tomar como observación de X, la cantidad x=F-1(u). En el caso en que X sea discreta se toma x como el percentil $100\cdot u$ de X, es decir el valor más pequeño que verifica que $F(x)\geq u$.
Este proceso se debe repetir n veces para obtener una muestra de tamaño n.

7.4.2.5 Ejemplo

Si queremos extraer n=10 muestras de una distribución ${ {{\bf N} \left ( 0,1 \right )} }$podemos recurrir a una tabla de números aleatorios de k=5cifras, en las que observamos las cantidades (por ejemplo)


\begin{displaymath}t{\leadsto}76.293,\,31.776,\, 50.803,\,71.153,\,20.271,\,
33.717,\,17.979,\,52.125,\, 41.330,\, 95.141
\end{displaymath}

A partir de ellas podemos obtener una muestra de $X{\leadsto}{ {{\bf N} \left( 0,1 \right)} }$usando una tabla de la distribución normal:

Números aleatorios Muestra ${ {{\bf U} \left( 0,1 \right)} }$ Muestra ${ {{\bf N} \left ( 0,1 \right )} }$
ti $u_i \approx \frac{t_i}{10^5}$ xi = F-1(ui)
76.293 0'76 0'71
31.776 0'32(=1-0'68) -0'47
50.803 0'51 0'03
71.153 0'71 0'55
20.271 0'20(=1-0'80) -0'84
33.717 0'34(=1-0'66) -0'41
17.979 0'18(=1-0'82) -0'92
52.125 0'52 0'05
41.330 0'41(=1-0'59) -0'23
95.141 0'95 1'65

Obsérvese que como era de esperar, las observaciones xi tienden a agruparse alrededor de la esperanza matemática de $X_i {\leadsto}{ {{\bf N} \left( \mu=0,\sigma^2=1 \right)} }$. Por otra parte, esto no implica que el valor medio de la muestra sea necesariamente $\overline{x}=0$. Sin embargo como sabemos por el teorema de Fisher que


\begin{displaymath}\overline{X} = \sum_{i=1}^{10} X_i {\leadsto}
{ {{\bf N} \le...
...overline{x}}=0,\sigma_{\overline{x}}^2=\frac{1}{10} \right)} }
\end{displaymath}

su dispersión con respecto al valor central es pequeña, lo que implica que probablemente el valor medio $\overline {x}$ estará muy próximo a 0, como se puede calcular:


\begin{displaymath}\overline{x}= \frac{1}{10} (0,71 + \cdots+ 1,65) = 0,012
\end{displaymath}

Obsérvese que si el problema fuese el inverso, donde únicamente conociésemos las observaciones xi y que el mecanismo que generó esos datos hubiese sido una distribución normal de parámetros desconocidos, con $\overline {x}$ obtenida hubiésemos tenido una buena aproximación del ``parámetro desconocido'' $\mu $. Sobre esta cuestión volveremos más adelante al abordar el problema de la estimación puntual de parámetros.


next up previous
Nodo Raíz: 7.4 Técnicas de muestreo sobre una
Siguiente: 7.4.4 Muestreo aleatorio estratificado
Previo: 7.4 Técnicas de muestreo sobre una

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo