Cuando analizábamos las variables unidimensionales considerábamos, entre otras medidas importantes, la media y la varianza. Ahora hemos visto que estas medidas también podemos considerarlas de forma individual para cada una de las componentes de la variable bidimensional.
Si observamos con atención los términos

vemos que las cantidades
y
van
al cuadrado y por tanto no pueden ser negativas.
La covarianza
,
es una manera de generalizar la varianza y se define como:
Como se ve, la fórmula es muy parecida a las de las varianzas.
Es sencillo comprobar que se verifica la siguiente expresión de
,
más útil en la práctica:
Si las observaciones no están ordenadas en una tabla de doble entrada, entonces se tiene que
o lo que es lo mismo
| 0 | 1 | 2 | 3 | 4 | |
| 0 | 4 | 6 | 9 | 4 | 1 |
| 1 | 5 | 10 | 7 | 4 | 2 |
| 2 | 7 | 8 | 5 | 3 | 1 |
| 3 | 5 | 5 | 3 | 2 | 1 |
| 4 | 2 | 3 | 2 | 1 | 0 |
Solución:En primer lugar, definimos las variables X= número de hijos varones, e Y=número de hijas y construimos la tabla con las frecuencias marginales, y con otras cantidades que nos son útiles en el cálculo de medias y varianzas:
|
|
y1 | y2 | y3 | y4 | y5 | ||||
|
|
0 | 1 | 2 | 3 | 4 |
|
|
|
![]() |
|
|
4 | 6 | 9 | 4 | 1 | 24 | 0 | 0 | 0 |
|
|
5 | 10 | 7 | 4 | 2 | 28 | 28 | 28 | 44 |
|
|
7 | 8 | 5 | 3 | 1 | 24 | 48 | 96 | 62 |
|
|
5 | 5 | 3 | 2 | 1 | 16 | 48 | 144 | 63 |
|
|
2 | 3 | 2 | 1 | 0 | 8 | 32 | 128 | 40 |
|
|
23 | 32 | 26 | 14 | 5 | 100 | 156 | 396 | 209 |
|
|
0 | 32 | 52 | 42 | 20 | 146 | |||
|
|
0 | 32 | 104 | 126 | 80 | 342 | |||
de este modo, las medias marginales son

Calculamos después las varianzas marginales

que nos dan directamente las desviaciones típicas marginales,

El número medio de hijas en las familias con 2 hijos varones
se obtiene calculando la distribución condicionada de
|
|
n3j | n3j yj |
|
|
7 | 0 |
|
|
8 | 8 |
|
|
5 | 10 |
|
|
3 | 9 |
|
|
1 | 4 |
| 24 | 31 |

Del mismo modo, el número medio de hijos varones de las familias sin
hijas, se calcula con la distribución condicionada
|
|
ni1 | ni1 xi |
|
|
4 | 0 |
|
|
5 | 5 |
|
|
7 | 14 |
|
|
5 | 15 |
|
|
2 | 8 |
| 23 | 42 |

El número medio de hijos varones en las familias que a lo sumo tienen dos hijas, se calcula usando las marginales de la tabla obtenida a partir de las columnas y1, y2 e y3
|
|
ni1 | ni2 | ni3 | ni1+ni2+ni3 | (ni1+ni2+ni3) xi |
|
|
4 | 6 | 9 | 19 | 19 |
|
|
5 | 10 | 7 | 22 | 22 |
|
|
7 | 8 | 5 | 20 | 40 |
|
|
5 | 5 | 3 | 13 | 39 |
|
|
2 | 3 | 2 | 7 | 28 |
| 81 | 129 | ||||
La covarianza es: