La distribución gaussiana, recibe también el nombre
de distribución normal, ya que una gran mayoría de las
v.a continuas6.3
de la naturaleza siguen esta distribución.
Se dice que una v.a. X sigue una distribución normal de parámetros
y
,
lo que representamos del modo
6.4
si su función de densidad es:
![\begin{eqnarray}\html{eqn64}{ {{\bf E} \left[ X \right]} }&=&\mu
\\
{ {{\bf Var } \left[ X \right]} }&=&\sigma^2
\end{eqnarray}](img1051.gif)
La forma de la función de densidad es la llamada campana de Gauss.
|
Para el lector es un ejercicio interesante comprobar que
ésta alcanza un único máximo (moda)
en
,
que es simétrica con respecto al mismo, y
por tanto
,
con lo cual
en
coinciden la media, la mediana y la moda,
y por último,calcular sus puntos de inflexión.
El soporte de la distribución es todo
,
de modo que la mayor parte
de la masa de probabilidad (área comprendida entre la curva y el
eje de abcisas) se encuentra concentrado alrededor de la media,
y las ramas de la curva se extienden asintóticamente a los ejes,
de modo que cualquier valor ``muy alejado" de la media es posible
(aunque poco probable).
La forma de la campana de Gauss depende de los parámetros
y
:
La función característica de la distribución normal, se comprueba más adelante que es
Como consecuencia, la distribución normal es reproductiva
con respecto a los parámetros
,
y
,
ya que

Las consecuencias desde el punto de vista práctico son importantes, ya que eso impide el que podamos escribir de modo sencillo la función de distribución de la normal, y nos tenemos que limitar a decir que:
sin poder hacer uso de ninguna expresión que la simplifique. Afortunadamente esto no impide que para un valor de xfijo, F(x) pueda ser calculado. De hecho puede ser calculado con tanta precisión (decimales) como se quiera, pero para esto se necesita usar técnicas de cálculo numérico y ordenadores. Para la utilización en problemas prácticos de la función de distribución F, existen ciertas tablas donde se ofrecen (con varios decimales de precisión) los valores F(x) para una serie limitada de valores xi dados. Normalmente F se encuentra tabulada para una distribución Z, normal de media 0 y varianza 1 que se denomina distribución normal tipificada:
En el caso de que tengamos una distribución diferente
,
se obtiene Z haciendo el siguiente
cambio:
De manera general se tiene6.8:
Este resultado puede ser utilizado del siguiente modo:
Si
,
y nos interesa calcular
,
y calculamos
tenemos que el valor obtenido en la tabla, FZ(z) es la probabilidad buscada.
de modo que
![\begin{eqnarray}\html{eqn78}{{\cal P}}[39\leq X\leq 48] &=&
{{\cal P}}[\frac{39...
... una tabla}
\nonumber \\
& \approx & 0,6293 -1 + 0,7486 =0,378
\end{eqnarray}](img1072.gif)
Vamos ahora a demostrar algunas de las propiedades de la ley gaussiana que hemos mencionado anteriormente.
![\begin{eqnarray}\html{eqn79}{ {{\bf E} \left[ X \right]} } &=& \mu
\\
& & \non...
...
& & \nonumber
\\
\phi_X(t)&=& e^{it\mu-\frac{1}{2}t^2\sigma^2}
\end{eqnarray}](img1073.gif)
Por ser la normal una ley de probabilidad se tiene que
es decir, esa integral es constante. Con lo cual, derivando la expresión
anterior con respecto a
se obtiene el valor 0:
![\begin{eqnarray}\html{eqn82}0 &=&
\int_{-\infty}^{+\infty}
{\scriptstyle \frac{1...
...c{1}{2}\,\left(\frac{x-\mu}{\sigma}\right)^2} \,dx
}_{=1}
\right]
\end{eqnarray}](img1075.gif)
Para demostrar la igualdad entre la
y
,
basta con
aplicar la misma técnica, pero esta vez derivando con respecto
a
:
Para demostrar el resultado relativo a la función característica, consideramos en primer lugar la v.a. tipificada de X,
y calculamos
aunque en realidad esta no da resultados muy precisos a menos
que realmente nsea un valor muy grande o
.
Como ilustración
obsérvense las figuras 6.10 y 6.11.
|
|
Solución: La v.a. que contabiliza el número de alumnos que padece la gripe es
Así aproximando la v.a. discreta binomial X, mediante la v.a. continua normal XN tenemos:
![\begin{eqnarray}\html{eqn83}{{\cal P}}[X\leq 40] &\approx& {{\cal P}}[X_N\leq 40...
...
\nonumber \\
\mbox{buscando en la tabla 3}&=& 0,999
\nonumber
\end{eqnarray}](img1095.gif)
También es necesario calcular
.
Esta probabilidad se calcula
exactamente como:
Dada la dificultad numérica para calcular esa cantidad, y como la distribución binomial no está habitualmente tabulada hasta valores tan altos, vamos a utilizar su aproximación normal, XN. Pero hay que prestar atención al hecho de que XN es una v.a. continua, y por tanto la probabilidad de cualquier punto es cero. En particular,
lo que ha de ser interpretado como un error de aproximación.
Hay métodos más aproximados para calcular la probabilidad buscada.
Por ejemplo, podemos aproximar
por el valor
de la función de densidad de XN en ese punto (es en el único sentido
en que se puede entender la función de densidad de la normal como
una aproximación de una probabilidad). Así:
Por último, otra posibilidad es considerar un intervalo de longitud 1centrado en el valor 60 del que deseamos hallar su probabilidad y hacer:
Solución:
Tenemos que
.
Si buscamos un
intervalo donde estar seguros de que el
de los habitantes
tengan sus alturas comprendidas en él hay varias estrategias posibles:
![\begin{eqnarray}\html{eqn83}\int_{-\infty}^{x_{0,5}} f(t)\,dt = 0,5
\;\;&\Longle...
...cando } &\Longleftrightarrow&\;\;
{{\cal P}}[Z\leq z_{0,5}] =0,5
\end{eqnarray}](img1104.gif)
donde

El valor z0,5 lo podemos buscar en la tabla 3 (distribución
)
y se obtiene
Por tanto podemos decir que la mitad de la población tiene una altura inferior
a
.
Este resultado era de esperar, ya que en la distribución
es simétrica y habrá una mitad de individuos con un peso inferior a
la media y otro con un peso superior (figura 6.12).
Esto puede escribirse como:
Elde la población tiene un peso comprendido en el intervalo
.
|
Elde la población tiene un peso comprendido en el intervalo
.
Para ello observamos que la mayor parte de probabilidad está concentrada
siempre alrededor de la media en las leyes gaussianas. Entonces podemos tomar
un intervalo que contenga un
de probabilidad del lado izquierdo más
próximo a la media, y un
del derecho (figura 6.13).
|
Esto se puede describir como el intervalo
donde x0,25 es el valor que deja por debajo de sí al
de la masa de probabilidad y x0,75 el que lo deja por encima (o lo
que es lo mismo, el que deja por debajo al
de las observaciones).
Del mismo modo que antes estos valores pueden ser buscados en una tabla
de la distribución normal, tipificando en primera instancia para destipificar
después:
![\begin{eqnarray}\html{eqn85}\int_{-\infty}^{x_{0,75}} f(t)\,dt = 0,75
\;\;&\Long...
...ndo } &\Longleftrightarrow&\;\;
{{\cal P}}[Z\leq z_{0,75}] =0,75
\end{eqnarray}](img1113.gif)
donde

En una tabla encontramos el valor z0,75, y se destipifica:
Análogamente se calcularía
![\begin{eqnarray}\html{eqn87}\int_{-\infty}^{x_{0,25}} f(t)\,dt = 0,25
\;\;&\Long...
...ndo } &\Longleftrightarrow&\;\;
{{\cal P}}[Z\leq z_{0,25}] =0,25
\end{eqnarray}](img1116.gif)
donde

Por la simetría de la distribución normal con respecto al origen, tenemos que z0,25= - z0,75.Luego
En conclusión:
Elde la población tiene un peso comprendido en el intervalo [168,25,181,75].
De entre los tres intervalos que se han calculado el que tiene más interés es el último, ya que es simétrico con respecto a la media, y es el más pequeño de todos los posibles (más preciso). Este ejemplo es en realidad una introducción a unas técnicas de inferencia estadística que trataremos posteriormente, conocidas con el nombre de ``estimación confidencial'' o ``cálculo de intervalos de confianza''.