Bioestadística – F.J. Barón López

Apuntes y vídeos de mis asignaturas en la Universidad de Málaga.

Archive for the “Primer ciclo” Category

Teorema del Límite Central

Posted on enero 23rd, 2009 by baron

Este vídeo tiene varios objetivos, así que aunque dura poco más de 9 minutos, es especialemente denso… Justificación de por qué la distribución normal ocupa un lugar privilegiado en estadística. Se introduce un concepto que suele ser confusos como error típico, y que se suele confundir con desviacion típica. Estad atentos, a la diferencia, pues [...]

Uso de la tabla de la distribución Normal

Posted on enero 22nd, 2009 by baron

Este vídeo es para los estudiantes de Medicina… He comprobado que se ha perdido parte del material que tenía preparado, así que en los próximos dias espero rehacer parte de él. Este trata sobre el uso de la tabla de la distribución normal tipificada para hacer cálculos de probabilidad sobre cualquier otra distribución normal. La [...]

Resumen de prácticas de descriptiva con SPSS

Posted on enero 19th, 2009 by baron

Breve guía sobre cómo hacer con SPSS los cálculos más habituales para presentar un trabajo de descriptiva.

Ejemplo de estudio de regresión lineal

Posted on abril 9th, 2008 by baron

Un pequeño ejemplo de la salida que nos ofrece SPSS.

Bondad de ajuste

Posted on abril 9th, 2008 by baron

Como medida de lo adecuado que es un ajuste de regresión, se utiliza una cantidad que se denota como  R2 y que también se denomina porcentaje de variabilidad explicado por el modelo de regresión, o coeficiente de determinación. En principio si tengo una variable dependiente, su varianza es una medida de la incertudimbre que tenemos [...]

Residuos

Posted on abril 9th, 2008 by baron

Los residuos son los errores cometidos al aproximar la variable dependiente por un modelo de regresión lineal. En término medio son nulos, pero lo interesante de ellos es su variabilidad, es decir su varianza. Cuando esta es muy grande (hay que precisar con respecto a qué), el modelo de regresión no es bueno.

Regresión lineal simple

Posted on abril 9th, 2008 by baron

El modelo de lineal simple es el modelo más sencillo de regresión. En él se utiliza a una variable independiente para predecir los valores de otra variable (dependiente). El modelo que se construye no es más que una recta. Las desviaciones con respecto a esa recta son los residuos del modelo.

Regresión

Posted on abril 9th, 2008 by baron

Introducción a terminología sobre regresión: variable dependiente, independiente, residuo,…

Coeficiente de correlación lineal de Pearson

Posted on abril 9th, 2008 by baron

Se utiliza muchísimo para describir la posible asociación lineal entre dos variables numéricas. Es el concepto que más claro hay que tener, junto al de bondad de ajuste, al tratar sobre correlación y regresión.

Covarianza

Posted on abril 9th, 2008 by baron

La covarianza es una medida de la variabilidad conjunta de dos variables. Tiene interés en el desarrollo de la teoría, pero no se usa en la práctica directamente.

Introducción a correlación y regresión

Posted on abril 9th, 2008 by baron

Una introducción a algunas ideas sobre correlación y regresión lineal.

Apuntamiento o curtosis

Posted on abril 6th, 2008 by baron

El apuntamiento o curtosis mide el alejamiento de la normalidad basándose en cómo son de altas las colas de la distribución. Cuando la distribución de los datos no presenta colas (los datos se distribuyen más o menos uniformemente en un intervalo) le corresponde un estadístico de curtosis con valor negativo. Si la distribución presenta colas [...]

Asimetría

Posted on abril 6th, 2008 by baron

Un estadístico de asimetría nos indica si la distribución presenta una cola a alguno de los lados de la distribución. Siendo la desviación normal muy importante en estadística, nos interesa describir las desviaciones de la normalidad. La distribución normal es simétrica, por tanto la asimetría es una indicación de falta de normalidad.

Medidas de dispersión

Posted on abril 6th, 2008 by baron

Nos dan una idea de la densidad con la que se agrupan los datos alrededor del centro. Algunas de las más usadas son: Rango: Distancia entre las observaciones mayor y menor. Rango intercuartílico. Distancia entre los percentiles 25 y 75. Es como el rango, pero ignorando a las observaciones más extrañas, y quedándonos solamente con [...]

Fuentes de variabilidad

Posted on abril 6th, 2008 by baron

Al repetirse el experimento de observar a un individuo de una población se pueden dar diferentes resultados. Aquí mencionamos algunas de las fuentes de variabilidad.

Cálculo manual de media y mediana

Posted on abril 6th, 2008 by baron

Ejemplo de cálculo de media y mediana. Sólo hay que verlo una vez en la vida. Normalmente nos lo hará el ordenador.

Medidas de centralización: Media, mediana y moda

Posted on abril 6th, 2008 by baron

Dan una idea de hacia dónde se agrupan los datos. El que se usa con mayor frecuencia es la media, aunque es preferible usar la mediana cuando los datos presentan observaciones anómalas o distribución asimétrica. La media muestral es el estadístico preferido cuando se utiliza como estimador de la media poblacional. La moda no es [...]

Diagrama de cajas de Tukey

Posted on abril 6th, 2008 by baron

Muestra los cuartiles (en realidad algo muy similar) y alguna información más. Nos permiten poder establecer comparaciones de variables numéricas (y ordinales) observadas en varios grupos. Son muy prácticos para identificar asociaciones entre variables numéricas y cualitativas.

Medidas de posición: percentiles

Posted on abril 6th, 2008 by baron

Las medidas de posición son los cuantiles y todas sus variantes: percentiles, terciles, cuartiles, quintiles, deciles,… Entre sus usos están: Dividir a la población en conjuntos con número similar de individuos Localizar observaciones muy bajas (o muy altas)

Parámetros y estadísticos

Posted on abril 6th, 2008 by baron

Parámetros y estadísticos son medidas numéricas de resumen de la información contenida en poblaciones y muestras (respectivamente). Cuando un estadístico se utiliza con el objetivo de utilizar una muestra para calcular de modo aproximado el valor de un parámetro, se denomina estimador. Los estadísticos los podemos dividir en varias categorías: posición (percentiles), centralización (media, mediana [...]

Histogramas

Posted on marzo 30th, 2008 by baron

Es el tipo de gráfico más importante para variables numéricas continuas. También se puede utilizar con variables discretas cuando presentan muchas modalidades.

Gráficos para variables numéricas

Posted on marzo 30th, 2008 by baron

Los que se construyen a partir de las frecuencias se denominan diferenciales. Cuando se construyen a partir de las frecuencias acumuladas se denominan integrales. Hay una diferencia entre cómo se representan, en función de que la variable sea discreta o continua.

Gráficos para variables cualitativas

Posted on marzo 30th, 2008 by baron

Los gráficos para variables cualitativas son principalmente los de barras (preferidos por mí), sectores y pictogramas. Estos últimos no suelen crearlos los programas estadísticos.

Tablas de frecuencias

Posted on marzo 30th, 2008 by baron

Las tablas de frecuencias muestran la información sobre la distribución de la variable de forma detallada… A veces demasiado, sobre todo si la variable es numérica.

Codificación de variables

Posted on marzo 30th, 2008 by baron

Aunque las variables sean de diferentes tipos, es preferible codificarlas en un ordenador como números.

Variables

Posted on marzo 30th, 2008 by baron

Hay varias posibilidades de clasificación de las variables. Una muy simple es la siguiente: Cualitativas (nominales u ordinales) y Numéricas (discretas o continuas).

Población y muestras

Posted on marzo 30th, 2008 by baron

Las muestras se utilizan para conseguir información aproximada de una población.