Para saber si una distribución de frecuencias es simétrica, hay que precisar con respecto a qué. Un buen candidato es la mediana, ya que para variables continuas, divide al histograma de frecuencias en dos partes de igual área. Podemos basarnos en ella para, de forma natural, decir que una distribución de frecuencias es simétrica si el lado derecho de la gráfica (a partir de la mediana) es la imagen por un espejo del lado izquierdo(figura 2.7).
Cuando la variable es discreta, decimos que es simétrica, si lo es con respecto a la media.
Dentro de los tipos de asimetría posible, vamos a destacar los dos fundamentales (figura 2.8):
Cuando realizamos un estudio descriptivo
es altamente improbable que la distribución de frecuencias sea
totalmente simétrica. En la práctica diremos que la distribución
de frecuencias es simétrica si lo es de un modo aproximado.
Por otro lado, aún observando cuidadosamente
la gráfica, podemos no ver claro de qué lado
están las frecuencias más altas. Conviene definir entonces
unos estadísticos que ayuden a interpretar la asimetría,
a los que llamaremos
índices de asimetría, y que denotaremos mediante
.
Vamos a definir a continuación algunos de los
índices de asimetría más usuales como son el
índice basado en los tres cuartiles, el momento de tercer orden
y la distancia entre la moda y la media o la media y la mediana.
Si una distribución es simétrica, es claro que deben haber tantas observaciones entre la que deja por debajo de sí las tres cuartas partes de la distribución y la mediana, como entre la mediana y la que deja por debajo de sí un quarto de todas las observaciones. De forma abreviada esto es,
Una pista para saber si una distribución de frecuencias es asimétrica positiva la descubrimos observando la figura 2.9):
Para quitar dimensionalidad al problema, utilizamos como índice de asimetría la cantidad:
Es claro que
El número obtenido,
,
es invariante ante cambios de origen
de referencia y de escala.
Sea X una variable cuantitativa y
.
Llamamos momento de orden p a:
Se denomina momento central de orden p a la cantidad
Si los datos están agrupados en una tabla, mp admite otra expresión equivalente:
El momento de orden 2 es la varianza muestral:
Es sencillo comprobar que los momentos de orden p impar, son
siempre nulos en el caso de variables simétricas, ya que para
cada i que esté a un lado de la media, con
,
le corresponde una observación j del otro lado de la media
tal que
.
Elevando cada una de
esas cantidades a p impar, y sumando se tiene que
Si la distribución fuese asimétrica positiva, las cantidades
,
con
impar positivas estarían muy aumentadas
al elevarse a p. Esta propiedad nos indica
que un índice de asimetría posible consiste en tomar p=3y definir
que para datos organizados en una tabla sería
Apoyandonos en este índice, diremos que hay asimetría positiva si a3>0, y que la asimetría es negativa si a3<0.
Basándonos en que si una distribución de frecuencias es simétrica y unimodal, entonces la media, la mediana y la moda coinciden, podemos definir otras medidas de asimetría, como son:
o bien,
Diremos que hay asimetría positiva si
y negativa si
(véase la figura 2.10).
| Intervalos | ni |
| 7 -- 9 | 4 |
| 9 -- 11 | 18 |
| 11 -- 12 | 14 |
| 12 -- 13 | 27 |
| 13 -- 14 | 42 |
| 14 -- 15 | 31 |
| 15 -- 17 | 20 |
| 17 -- 19 | 1 |
Determinar la variabilidad de la edad mediante los estadísticos varianza, desviación típica, coeficiente de variación y rango intercuartílico. Estudie la simetría de la variable.
Solución:
En primer lugar realizamos los cálculos necesarios a partir de la tabla de frecuencias:
| Intervalos | ni | xi | Ni | xi ni | xi2 ni |
| 7 -- 9 | 4 | 8 | 4 | 32 | 256 |
| 9 -- 11 | 18 | 10 | 22 | 180 | 1.800 |
| 11 -- 12 | 14 | 11,5 | 36 | 161 | 1.851,5 |
| 12 -- 13 | 27 | 12,5 | 63 | 337,5 | 4.218,75 |
| 13 -- 14 | 42 | 13,5 | 105 | 567 | 7.654,5 |
| 14 -- 15 | 31 | 14,5 | 136 | 449,5 | 6.517,75 |
| 15 -- 17 | 20 | 16 | 156 | 320 | 5.120 |
| 17 -- 19 | 1 | 18 | 157 | 18 | 324 |
| 157 | 2.065 | 27.742,25 |
La media es
años.
La varianza la calculamos a partir
de la columna de la xi2 ni como sigue:
El coeficiente de variación no posee unidades y es:
En lo que concierne a la simetría podemos utilizar el coeficiente de asimetría de Yule-Bowley, para el cual es preciso el cálculo de los cuartiles:
Lo que nos dice que aproximadamente en un rango de
años
se encuentra el
central del total de observaciones2.1
Además:
Este resultado nos indica que existe una ligera asimetría a la izquierda (negativa). Un resultado similar se obtiene si observamos (Figura 2.11) que la distribución de frecuencias es unimodal, siendo la moda:
en cuyo caso podemos usar como medida del sesgo: