up
next previous
Nodo Raíz: 3. Variables bidimensionales
Siguiente: 3.4.2 Distribuciones marginales
Previo: 3.2 introducción

3.4 Tablas de doble entrada

Consideramos una población de n individuos, donde cada uno de ellos presenta dos caracteres que representamos mediante las variables X e Y. Representamos mediante

\begin{displaymath}X {\leadsto}x_1, x_2, \dots, x_i, \dots, x_k \end{displaymath}

las k modalidades que presenta la variable X, y mediante

\begin{displaymath}Y {\leadsto}y_1, y_2, \dots, y_j, \dots, y_p \end{displaymath}

las p modalidades de Y.

Con la intención de reunir en una sóla estructura toda la información disponible, creamos una tabla formada por $k\cdot p$ casillas, organizadas de forma que se tengan k filas y p columnas. La casilla denotada de forma general mediante el $\mbox{subíndice}_{ij}$ hará referencia a los elementos de la muestra que presentan simultáneamente las modalidades xi e yj.

Y y1 y2 ... yj ... yp  
X
x1 n11 n12 ... n1j ... n1p $n_{1{{\scriptscriptstyle \bullet}}}$
x2 n21 n22 ... n2j ... n2p $n_{2{{\scriptscriptstyle \bullet}}}$
... ... ... ... ... ... ... ...
xi ni1 ni2 ... nij ... nip $n_{i{{\scriptscriptstyle \bullet}}}$
... ... ... ... ... ... ... ...
xk nk1 nk2 ... nkj ... nkp $n_{k{{\scriptscriptstyle \bullet}}}$
  $n_{{{\scriptscriptstyle \bullet}}1}$ $n_{{{\scriptscriptstyle \bullet}}2}$ ... $n_{{{\scriptscriptstyle \bullet}}j}$ ... $n_{{{\scriptscriptstyle \bullet}}p}$ $n_{{{\scriptscriptstyle \bullet}}{{\scriptscriptstyle \bullet}}}$

De este modo, para $i=1,\dots,k$, $j=1,\dots,p$, se tiene que nij es el número de individuos o frecuencia absoluta, que presentan a la vez las modalidades xi e yj.

El número de individuos que presentan la modalidad xi, es lo que llamamos frecuencia absoluta marginal de xi y se representa como $n_{i{{\scriptscriptstyle \bullet}}}$. Es evidente la igualdad


\begin{displaymath}n_{i{{\scriptscriptstyle \bullet}}} = n_{i1}+n_{i2}+\cdots+n_{ip}=\sum_{j=1}^p n_{ij}
\end{displaymath}

Obsérvese que hemos escrito un símbolo `` ${{\scriptscriptstyle \bullet}}$'' en la ``parte de las jotas'' que simboliza que estamos considerando los elemento que presentan la modalidad xi, independientemente de las modalidades que presente la variable Y. De forma análoga se define la frecuencia absoluta marginal de la modalidad yj como


\begin{displaymath}n_{{{\scriptscriptstyle \bullet}}j} = n_{1j}+n_{2j}+\cdots+n_{kj} = \sum_{i=1}^k n_{ij}
\end{displaymath}

Estas dos distribuciones de frecuencias $n_{i{{\scriptscriptstyle \bullet}}}$ para $i=1,\dots,k$, y $n_{{{\scriptscriptstyle \bullet}}j}$para $j=1,\dots,p$ reciben el nombre de distribuciones marginales de X e Y respectivamente.

El número total de elementos de la población (o de la muestra), n lo obtenemos de cualquiera de las siguientes formas, que son equivalentes:


\begin{displaymath}n = n_{{{\scriptscriptstyle \bullet}}{{\scriptscriptstyle \bu...
...riptscriptstyle \bullet}}j} = \sum_{i=1}^k \sum_{j=1}^p n_{ij}
\end{displaymath}

Las distribuciones de frecuencias de las variables bidimensionales también pueden ser representadas gráficamente. Al igual que en el caso unidimensional existen diferentes tipos de representaciones gráficas, aunque estas resultan a ser más complicadas (figura 3.1).


  
Figura: Algunos de las representaciones gráficas habituales de distribuciones de frecuencias bidimensionales.
\includegraphics[angle=-90, width=0.9\textwidth]{fig03-01.epsi}



 
next up previous
Nodo Raíz: 3. Variables bidimensionales
Siguiente: 3.4.2 Distribuciones marginales
Previo: 3.2 introducción

Éste texto es la versión electrónica del manual de la Universidad de Málaga:
Bioéstadística: Métodos y Aplicaciones
U.D. Bioestadística. Facultad de Medicina. Universidad de Málaga.
ISBN: 847496-653-1
Bioestadística: Apuntes en vídeo