up
next previous
Nodo Raíz: 7. Introducción a la inferencia
Siguiente: 7.6.2 Carencia de sesgo
Previo: 7.4.8 Muestreo por conglomerados

7.6 Propiedades deseables de un estimador

Sea X una v.a. cuya función de probabilidad (o densidad de probabilidad si es continua) depende de unos parámetros $\theta_1,\dots,\theta_k$ desconocidos.

\begin{displaymath}f(x;\,\theta_1,\theta_2,\dots,\theta_k)
\end{displaymath}

Representamos mediante $X_1,\dots,X_n$una muestra aleatoria simple de la variable. Denotamos mediante fc a la función de densidad conjunta de la muestra, que por estar formada por observaciones independientes, puede factorizarse del siguiente modo:

\begin{displaymath}f_c(x_1,x_2,\dots,x_n;\,\theta_1,\dots,\theta_k)=
f(x_1;\,\th...
...theta_1,\dots,\theta_k)\cdots
f(x_n;\,\theta_1,\dots,\theta_k)
\end{displaymath}

Se denomina estimador de un parámetro $\theta_i$, a cualquier v.a. $\hat{\theta}_i$ que se exprese en función de la muestra aleatoria y que tenga por objetivo aproximar el valor de $\theta_i$, \begin{displaymath}\hat{\theta}_i(X_1,\dots,X_n) \qquad \longleftarrow
\qquad \mbox{estimador de }\, \theta_i.
\end{displaymath}

Obsérvese que el estimador no es un valor concreto sino una variable aleatoria, ya que aunque depende unívocamente de los valores de la muestra observados (Xi=xi), la elección de la muestra es un proceso aleatorio. Una vez que la muestra ha sido elegida, se denomina estimación el valor numérico que toma el estimador sobre esa muestra.

Intuitivamente, las características que serían deseables para esta nueva variable aleatoria (que usaremos para estimar el parámetro desconocido) deben ser:

* Consistencia
Cuando el tamaño de la muestra crece arbitrariamente, el valor estimado se aproxima al parámetro desconocido.
* Carencia de sesgo
El valor medio que se obtiene de la estimación para diferentes muestras debe ser el valor del parámetro.
* Eficiencia
Al estimador, al ser v.a., no puede exigírsele que para una muestra cualquiera se obtenga como estimación el valor exacto del parámetro. Sin embargo podemos pedirle que su dispersión con respecto al valor central (varianza) sea tan pequeña como sea posible.
* Suficiencia
El estimador debería aprovechar toda la información existente en la muestra.

A continuación vamos a enunciar de modo más preciso y estudiar cada una de esas características.

7.6.0.1 Ejemplo

 Consideremos una v.a. de la que sólo conocemos que su ley de distribución es gaussiana,


\begin{displaymath}X{\leadsto}{ {{\bf N} \left( \mu,\sigma^2 \right)} }
\qquad
\...
... \equiv \sigma^2,\qquad \mbox{desconocido.}
\end{array}\right.
\end{displaymath}

Para muestras aleatorias de tamaño n=3,


\begin{displaymath}X_1,X_2,X_3 {\leadsto}{ {{\bf N} \left( \mu,\sigma^2 \right)} }
\end{displaymath}

un posible estimador del parámetro $\mu $ es


\begin{displaymath}\hat{\theta_1}(X_1,X_2,X_3) \equiv \overline{X} =
\frac{1}{3...
...\leadsto}
{ {{\bf N} \left( \mu,\frac{\sigma^2}{3} \right)} }
\end{displaymath}

Si al realizar un muestreo aleatorio simple obtenemos

\begin{displaymath}\left.
\begin{array}{c}
X_1=2
\\
X_2=4
\\
X_3 = 0
\end{arra...
...eta}_1$\space es}
\qquad \hat{\theta}_1(2,4,0)=\overline{x}=3.
\end{displaymath}

Hemos dicho que el estimador sirve para aproximar el valor de un parámetro desconocido, pero... ¿si el parámetro es desconocido cómo podemos decir que un estimador dado sirve para aproximarlo? Así pues, es necesario que definamos en qué sentido un estimador es bueno para cierto parámetro.



 
next up previous
Nodo Raíz: 7. Introducción a la inferencia
Siguiente: 7.6.2 Carencia de sesgo
Previo: 7.4.8 Muestreo por conglomerados

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo