up
next previous
Nodo Raíz: 6.4 Distribuciones discretas
Siguiente: 6.4.6 Distribución geométrica ( o de
Previo: 6.4.2 Distribución de Bernoulli

Subsecciones

6.4.4 Distribución binomial

Se dice que una v.a. X sigue una ley binomial de parámetros n y p, $X {\leadsto}{ {{\bf B} \left( n,p \right)} }$, si es la suma de n v.a. independientes de Bernouilli con el mismo parámetro, p:  \begin{displaymath}X {\leadsto}{ {{\bf B} \left( n,p \right)} } \Longleftrightar...
...}{ {{\bf Ber} \left( p \right)} }, \: \forall \, i =1,\dots, n
\end{displaymath}
Esta definición puede interpretarse en el siguiente sentido: Supongamos que realizamos n pruebas de Bernouilli, Xi, donde en todas ellas, la probabilidad de éxito es la misma (p), y queremos calcular el número de éxitos, X, obtenidos el el total de las n pruebas. Su ley de probabilidad es6.1 En la Figura 6.1 se representa la función de probabilidad de una variable binomial.


  
Figura: Función de probabilidad de una variable binomial cunado n es pequeño.
\includegraphics[angle=0, width=0.7\textwidth]{fig06-01.eps}


  
Figura: Función de probabilidad de una variable binomial cuando n es grande.
\includegraphics[angle=0, width=0.7\textwidth]{fig06-02.eps}

\begin{displaymath}{
\mbox{\fbox{$\displaystyle
f(k) = P[X=k] = { \left(\begin{...
...right)\,} p^k q^{n-k} \qquad \forall \, k=0,1,\dots, n
$ } }
}
\end{displaymath}

Por tanto, su función de distribución es


\begin{displaymath}F(x) = \left\{
\begin{array}{ll}
0 & \mbox{ si } x < 0
\\
\\...
...q x \leq n
\\
\\
1 & \mbox{ si } x \geq n
\end{array}\right.
\end{displaymath}

El modo más simple de calcular la función característica nos lo da el teorema de la página [*], que afirma que la función característica de la suma de variables independientes es el producto de las funciones características de estas:


\begin{displaymath}\phi_X(t) = \phi_{X_1 + \dots+X_n}(t) = \phi_{X_1}(t)\cdots\p...
...ight) \cdots \left(q+pe^{it}\right) =
\left(q+pe^{it}\right)^n
\end{displaymath}

Los principales momentos de X los calculamos más fácilmente a partir de $\phi_X$ (prop. página 5) que de su propia definición:


\begin{displaymath}{ {{\bf E} \left[ X \right]} } = \left.
\frac{\phi_X^,(t)}{i}...
...t _{t=0}
=np\,{\underbrace{\left(p +q\right)}_{=1}}^{n-1} = np
\end{displaymath}

\begin{eqnarray}\html{eqn9}\nonumber
{ {{\bf E} \left[ X^2 \right]} } &=& \left....
...race{\left(p +q\right)}_{=1}}^{n-1}=
n(n-1)\,p^2 + np
\nonumber
\end{eqnarray}



\begin{displaymath}{ {{\bf Var } \left[ X \right]} }={ {{\bf E} \left[ X^2 \righ...
...ht]} }^2 = n(n-1)\,p^2 + np - n^2p^2= -np^2+np
= np(1-p) = npq
\end{displaymath}

6.4.4.1 Ejemplo

Un médico aplica un test a 10 alumnos de un colegio para detectar una enfermedad cuya incidencia sobre una población de niños es del $10\%$. La sensibilidad del test es del $80\%$ y la especificidad del $75\%$. ¿Cual es la probabilidad de que exactamente a cuatro personas le de un resultado positivo? Si en la muestra hay cuatro personas a las que el test le da positivo, ¿cuál es la probabilidad de que entre estas, exactamente dos estén sanas? Calcular la probabilidad de que el test suministre un resultado incorrecto para dos personas. Calcular la probabilidad de que el resultado sea correcto para más de 7 personas.

Solución:

Los datos de que disponemos son:

\begin{eqnarray}\html{eqn9}{{\cal P}}[E] &=& 0,1 \qquad
\underbrace{\mbox{preva...
...E}}] &=& 0,75 \qquad \mbox{especificidad
(verdaderos negativos)}
\end{eqnarray}


donde E, T+, y T- tienen el sentido que es obvio. Si queremos saber a cuantas personas el test le dará un resultado positivo, tendremos que calcular ${{\cal P}}[T^+]$, para lo que podemos usar el teorema de la probabilidad total (estar enfermo y no estarlo forman una colección exhaustiva y excluyente de sucesos):

\begin{eqnarray}\html{eqn10}{{\cal P}}[T^+] &=& {{\cal P}}[{T^+}_{\mid E}]\cdot ...
...onumber \\
&=& 0,8\times 0,1 + 0,25\times 0,9 = 0,305
\nonumber
\end{eqnarray}


Sea X1 la v.a. que contabiliza el número de resultados positivos. Es claro que llamando $p_1={{\cal P}}[T^+]$, se tiene que X sigue una distribución binomial


\begin{displaymath}X_1 {\leadsto}{ {{\bf B} \left( n_1=10,p_1=0,305 \right)} } \...
...egin{array}{c} n_1\\ k \end{array}\right)\,}\,p_1^kq_1^{n_1-k}
\end{displaymath}

Por ello la probabilidad de que a cuatro personas le de el resultado del test positivo es:


\begin{displaymath}{{\cal P}}[X_1=4] = { \left(\begin{array}{c} 10\\ 4 \end{array}\right)\,} 0,305^4\cdot 0,695^6 = 0,2048
\end{displaymath}

Si queremos calcular a cuantas personas les dará el test un resultado positivo aunque en realidad estén sanas, hemos de calcular previamente ${{\cal P}}[\overline{E}_{\mid T^+}]$, o sea, el índice predictivo de falsos positivos:


\begin{displaymath}{{\cal P}}[\overline{E}_{\mid T^+}]= \frac{{{\cal P}}[\overli...
...[\overline{E}]}^{1-{{\cal P}}[E]}
}{
{{\cal P}}[T^+]} = 0,7377
\end{displaymath}

Es importante observar este resultado. Antes de hacer los cálculos no era previsible que si a una persona el test le da positivo, en realidad tiene una probabilidad aproximadamente del $74\%$ de estar sana. Sea X2 la variable aleatoria que contabiliza al número de personas al que el test le da positivo, pero que están sanas en realidad. Entonces


\begin{displaymath}X_2 {\leadsto}{ {{\bf B} \left( n_2=4,p_2=0,7377 \right)} } \...
...egin{array}{c} n_2\\ k \end{array}\right)\,}\,p_2^kq_2^{n_2-k}
\end{displaymath}

y


\begin{displaymath}{{\cal P}}[X_2=2] = { \left(\begin{array}{c} 4\\ 2 \end{array}\right)\,} 0,7377^2\cdot 0,2623^2 = 0,22465
\end{displaymath}

Por último vamos a calcular la probabilidad p3 de que el test de un resultado erróneo, que es:

\begin{eqnarray}\html{eqn10}p_3 &=& {{\cal P}}[
\underbrace{(T^+{\cap}\overline{...
...onumber \\
&=& 0,25\times 0,9 + 0,2\times 0,1 = 0,245
\nonumber
\end{eqnarray}


La variable aleatoria que contabiliza el número de resultados erróneos del test es


\begin{displaymath}X_3 {\leadsto}{ {{\bf B} \left( n_3=10,p_3=0,245 \right)} } \...
...egin{array}{c} n_3\\ k \end{array}\right)\,}\,p_3^kq_3^{n_3-k}
\end{displaymath}

Como la probabilidad de que el test sea correcto para más de siete personas, es la de que sea incorrecto para menos de 3, se tiene

\begin{eqnarray}\html{eqn10}{{\cal P}}[X_3<3] &=& \underbrace{{{\cal P}}[X_3\leq...
... 0,755^{8}
\nonumber \\
& &
\nonumber \\
&=& 0,5407
\nonumber
\end{eqnarray}



next up previous
Nodo Raíz: 6.4 Distribuciones discretas
Siguiente: 6.4.6 Distribución geométrica ( o de
Previo: 6.4.2 Distribución de Bernoulli

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo