Este vídeo tiene varios objetivos, así que aunque dura poco más de 9 minutos, es especialemente denso… Justificación de por qué la distribución normal ocupa un lugar privilegiado en estadística. Se introduce un concepto que suele ser confusos como error típico, y que se suele confundir con desviacion típica. Estad atentos, a la diferencia, pues [...]
Este vídeo es para los estudiantes de Medicina… He comprobado que se ha perdido parte del material que tenía preparado, así que en los próximos dias espero rehacer parte de él. Este trata sobre el uso de la tabla de la distribución normal tipificada para hacer cálculos de probabilidad sobre cualquier otra distribución normal. La [...]
Breve guía sobre cómo hacer con SPSS los cálculos más habituales para presentar un trabajo de descriptiva.
Un pequeño ejemplo de la salida que nos ofrece SPSS.
Como medida de lo adecuado que es un ajuste de regresión, se utiliza una cantidad que se denota como R2 y que también se denomina porcentaje de variabilidad explicado por el modelo de regresión, o coeficiente de determinación. En principio si tengo una variable dependiente, su varianza es una medida de la incertudimbre que tenemos [...]
Los residuos son los errores cometidos al aproximar la variable dependiente por un modelo de regresión lineal. En término medio son nulos, pero lo interesante de ellos es su variabilidad, es decir su varianza. Cuando esta es muy grande (hay que precisar con respecto a qué), el modelo de regresión no es bueno.
El modelo de lineal simple es el modelo más sencillo de regresión. En él se utiliza a una variable independiente para predecir los valores de otra variable (dependiente). El modelo que se construye no es más que una recta. Las desviaciones con respecto a esa recta son los residuos del modelo.
Introducción a terminología sobre regresión: variable dependiente, independiente, residuo,…
Se utiliza muchísimo para describir la posible asociación lineal entre dos variables numéricas. Es el concepto que más claro hay que tener, junto al de bondad de ajuste, al tratar sobre correlación y regresión.
La covarianza es una medida de la variabilidad conjunta de dos variables. Tiene interés en el desarrollo de la teoría, pero no se usa en la práctica directamente.
Una introducción a algunas ideas sobre correlación y regresión lineal.
El apuntamiento o curtosis mide el alejamiento de la normalidad basándose en cómo son de altas las colas de la distribución. Cuando la distribución de los datos no presenta colas (los datos se distribuyen más o menos uniformemente en un intervalo) le corresponde un estadístico de curtosis con valor negativo. Si la distribución presenta colas [...]
Un estadístico de asimetría nos indica si la distribución presenta una cola a alguno de los lados de la distribución. Siendo la desviación normal muy importante en estadística, nos interesa describir las desviaciones de la normalidad. La distribución normal es simétrica, por tanto la asimetría es una indicación de falta de normalidad.
Nos dan una idea de la densidad con la que se agrupan los datos alrededor del centro. Algunas de las más usadas son: Rango: Distancia entre las observaciones mayor y menor. Rango intercuartílico. Distancia entre los percentiles 25 y 75. Es como el rango, pero ignorando a las observaciones más extrañas, y quedándonos solamente con [...]
Al repetirse el experimento de observar a un individuo de una población se pueden dar diferentes resultados. Aquí mencionamos algunas de las fuentes de variabilidad.
Ejemplo de cálculo de media y mediana. Sólo hay que verlo una vez en la vida. Normalmente nos lo hará el ordenador.
Dan una idea de hacia dónde se agrupan los datos. El que se usa con mayor frecuencia es la media, aunque es preferible usar la mediana cuando los datos presentan observaciones anómalas o distribución asimétrica. La media muestral es el estadístico preferido cuando se utiliza como estimador de la media poblacional. La moda no es [...]
Muestra los cuartiles (en realidad algo muy similar) y alguna información más. Nos permiten poder establecer comparaciones de variables numéricas (y ordinales) observadas en varios grupos. Son muy prácticos para identificar asociaciones entre variables numéricas y cualitativas.
Las medidas de posición son los cuantiles y todas sus variantes: percentiles, terciles, cuartiles, quintiles, deciles,… Entre sus usos están: Dividir a la población en conjuntos con número similar de individuos Localizar observaciones muy bajas (o muy altas)
Parámetros y estadísticos son medidas numéricas de resumen de la información contenida en poblaciones y muestras (respectivamente). Cuando un estadístico se utiliza con el objetivo de utilizar una muestra para calcular de modo aproximado el valor de un parámetro, se denomina estimador. Los estadísticos los podemos dividir en varias categorías: posición (percentiles), centralización (media, mediana [...]
Es el tipo de gráfico más importante para variables numéricas continuas. También se puede utilizar con variables discretas cuando presentan muchas modalidades.
Los que se construyen a partir de las frecuencias se denominan diferenciales. Cuando se construyen a partir de las frecuencias acumuladas se denominan integrales. Hay una diferencia entre cómo se representan, en función de que la variable sea discreta o continua.
Los gráficos para variables cualitativas son principalmente los de barras (preferidos por mí), sectores y pictogramas. Estos últimos no suelen crearlos los programas estadísticos.
Las tablas de frecuencias muestran la información sobre la distribución de la variable de forma detallada… A veces demasiado, sobre todo si la variable es numérica.
Aunque las variables sean de diferentes tipos, es preferible codificarlas en un ordenador como números.
Hay varias posibilidades de clasificación de las variables. Una muy simple es la siguiente: Cualitativas (nominales u ordinales) y Numéricas (discretas o continuas).
Las muestras se utilizan para conseguir información aproximada de una población.