Bioestadística – F.J. Barón López

Apuntes y vídeos de mis asignaturas en la Universidad de Málaga.

Algunas notas sobre cómo presentar estadísticas

Posted on enero 13th, 2009 by baron

Solo una breve guía de cómo presentar los resultados estadísticos enlos trabajos de máster o DEA.

Práctica con MS OFFICE WORD (1ª parte)

Posted on noviembre 29th, 2008 by baron

Ved este vídeo antes de hacer la práctica correspondiente. Trata sobre la estructura lógica que debe tener un documento: Una publicación, tesina, libro, etc…

Adjunto tenéis el fichero en word original sobre el que se trabajará: quidquid-latine-dictum-sit.doc

Práctica con MS OFFICE WORD (2ª parte)

Posted on noviembre 30th, 2008 by baron

En este vídeo vemos cómo modificar la presentación de los párrafos (justificación, sangrado, interlineado,…) en todo el texto, modificando la definición de los estilos que corresponden.

Práctica con MS OFFICE WORD (3ª parte)

Posted on noviembre 30th, 2008 by baron

Esta práctica trata sobre cómo dar númeración a objetos como tablas e ilustraciones para después usarlas creando índices de ellas además de poder referenciarlas desde el texto (referencias cruzadas). El resultado final debe ser similar a esto: quidquid-latine-dictum-sit_v2.doc

Práctica con MS OFFICE WORD (4ª parte)

Posted on diciembre 3rd, 2008 by baron

En esta práctica dividiremos el documento de trabajo en varias partes denominadas secciones (sí, el nombre no es muy afortunado, lo sé):

  • Portada,
  • Índices,
  • Capítulos,
  • Anexos,

Cada uno usa un diseño de página diferente tanto en numeración como en encabezados, pie de página o incluso orientación del papel.

Aunque lo que vamos a hacer no es muy complicado, sí que resulta difícil arreglar cualquier error, pues una buena parte de la configuración del documento está basado en marcas no visibles, así que cualquier error resulta difícil de descubrir. Hay que dar cada paso con mucho cuidado.

Para sacarle provecho a la práctica, vedla una primera vez para sacar una idea general, y una segunda vez para recordar cual es el proceso. Para aquellos que tengáis dificultad tendremos el seminario el martes 9 de diciembre de 2008 en el aula de informática del decanato de la Facultad de Filosofía y Letras.

Plano de localización

Uso de Zotero para las referencias bibliográficas

Posted on noviembre 10th, 2009 by baron

  1. Instalad mozilla firefox
  2. Instalad el plugin de zotero
  3. Instalad el plugin de zotero para word

Después descargad este vídeo para ver cómo se usa. si no podéis reproducirlo, probad a bajar VIDEOLAN. O bien podéis verlo dentro del mismo navegador en este enlace.

Aviso de Pablo Davó: La herramienta zotero se instala en un sitio bastante extraño en Office 2007. La encontraréis en la pestaña del “ribbon” titulada “complementos” (fijáos en la captura de pantalla).
Captura Office 2007+Zotero

Teorema del Límite Central

Posted on enero 23rd, 2009 by baron

Este vídeo tiene varios objetivos, así que aunque dura poco más de 9 minutos, es especialemente denso…

  • Justificación de por qué la distribución normal ocupa un lugar privilegiado en estadística.
  • Se introduce un concepto que suele ser confusos como error típico, y que se suele confundir con desviacion típica. Estad atentos, a la diferencia, pues tienen que ver, pero no son lo mismo.
  • Muestra la importancia que tiene el tamaño de muestra en la precisión de una estimación.
  • Introduce los intervalos de confianza.

Sobre cálculo de tamaños de muestras.

Posted on noviembre 12th, 2009 by baron

Empezad mirando esto sobre muestreo, para después pasar a ver esto sobre cálculo de tamaño de muestras.

Tampoco está mal echarle un vistazo a este artículo [fuente wiley-interscience] donde se tratan de pasada los problemas del tamaño muestral, la falta de aleatorización y su corrección mediante la introducción de variables de control y su correspondiente análisis multivariante.

Cálculo de tamaño de muestras para comparar 2 grupos

Posted on abril 10th, 2008 by baron

Uno de los problemas más frecuentes en el diseño de un estudio, es el del cálculo del tamaño muestral necesario para comparar 2 gupos.

Cuando la variable es numérica necesitamos conocer:

  • La variabilidad (desviación típica) presente en cada grupo, o al menos una estimación de ella. Para ello nos ayudaremos de publicaciones anteriores, o de muestras piloto.
  • La diferencia (mínima) que creemos que existe entre ambos grupos, y que nos gustaría ser capaces de detectar con nuestro estudio.

Después nos iremos a la página de Russell Lenth para calcular el tamaño de muestra necesario. En este caso se trata de usar la opción “Two sample t-test“.

El resto es una cuestión de jugar con la potencia (probabilidad de que si nuestra hipótesis de que existe un efecto real es cierta declaremos el contraste significativo) para ver qué consecuencias tiene en el tamaño muestral.

Cuando la variable es dicotómica, (Sí/No) normalmente nuestro interés será comparar diferencias de porcentajes de éxitos entre 2 grupos. Para ello elegiremos la opción “Test comparing two proportions“. Aquí sólo hay que ajustar dos parámetros (p1 y p2) que indican las proporciones que pensamos que existen en las poblaciones reales. La diferencia entre ambas proporciones nos indica la magnitud (mínima) del efecto que estamos interesados en detectar.

Lectura de artículos: Chi cuadrado y t-student

Posted on noviembre 19th, 2009 by baron

En este artículo veremos cómo se contrastan multitud de hipótesis (muchas bastante sosas en apariencia) usando pruebas chi-cuadrado y t-student. La cantidad de hipótesis es tan alta que no se enuncian explícitamente… Se deducen cuáles son por la forma de redactar las tablas.

El artículo es: http://heapro.oxfordjournals.org/cgi/reprint/19/4/428.pdf

Trata sobre factores asociados al consumo de tabaco en adolescentes. Fijáos especialmente en cómo controlan el efecto de una variable que les puede dar muchos problemas en el análisis: La edad en los adolescentes. ¡No es lo mismo tener 13 años que 15!
En vez de usar una aproximación mutivariante, usan un método seguro y fácil de interpretar: Estratifican los resultados por edades.

Lectura de artículos: regresión múltiple

Posted on noviembre 12th, 2009 by baron

En http://www.oxfordjournals.org tenéis múltiples revistas con contenido accesible. Intentad interpretar este (sacado de http://intqhc.oxfordjournals.org/cgi/content/abstract/8/5/447).

Lectura de artículos: 1ºANOVA, 2ºRegresión múltiple

Posted on noviembre 19th, 2009 by baron

En este artículo vamos a ver un ejemplo típico de uso de pruebas ANOVA (comparar grupos sin tener encuenta variables de control), para posteriormente introducir variables de control, y resolver la misma cuestión con análisis multivariante (regresión multiple).
http://jpubhealth.oxfordjournals.org/cgi/reprint/28/3/192.pdf

Además es interesante ver que la variable numérica a comparar no es una “variable cualquiera”… Se obtiene “automágicamente” a partir de las respuestas a un cuestionario por un proceso que se llama análisis factorial. Os haré una pequeña introducción en la próxima clase.

Variables

Posted on marzo 30th, 2008 by baron

Hay varias posibilidades de clasificación de las variables. Una muy simple es la siguiente: Cualitativas (nominales u ordinales) y Numéricas (discretas o continuas).

Referencias Bibliográficas: Zotero

Posted on diciembre 14th, 2008 by baron

Para realizar esta práctica es necesario:

  • Usar Mozilla Firefox como navegador web. Sigue el enlace para descargarlo, en caso de que no lo tengas.
  • Instalar el complemento (plugin) ZOTERO. Para ello debes ir al enlace indicado y elegir la versión que prefieras (1.0.x) o (1.5 Sync preview). La última no está tan sólidamente probada, pero ofrece algunas ventajas (como la sincronización de bibliografías) entre diferentes ordenadores, que tal vez os haga valer la pena correr el riesgo.
  • Instalar el complemento para MS Word de Zotero. Para ello debes ir a este enlace si has elegido en el paso anterior instalar la versión 1.0.x, o este otro enlace si has elegido la versión 1.5 sync preview.

En prácticas anteriores hemos visto cómo usar referencias internas (denominado referencias cruzadas) a partes del documento que nosotros mismos estabamos elaborando. En este caso el vídeo muestra una introducción a Zotero, que nos permitirá hacer referencias bibliográficas, es decir, referencias a documentos externos (que forman parte de otros documentos).

La práctica, como viene siendo habitual la haremos en el aula de informática de la Facultad de Filosofía y letras. Será el martes 15/12/08 a partir de las 17:00.

Población y muestras

Posted on marzo 30th, 2008 by baron

Las muestras se utilizan para conseguir información aproximada de una población.

Codificación de variables

Posted on marzo 30th, 2008 by baron

Aunque las variables sean de diferentes tipos, es preferible codificarlas en un ordenador como números.

Tablas de frecuencias

Posted on marzo 30th, 2008 by baron

Las tablas de frecuencias muestran la información sobre la distribución de la variable de forma detallada… A veces demasiado, sobre todo si la variable es numérica.

Gráficos para variables cualitativas

Posted on marzo 30th, 2008 by baron

Los gráficos para variables cualitativas son principalmente los de barras (preferidos por mí), sectores y pictogramas. Estos últimos no suelen crearlos los programas estadísticos.

Gráficos para variables numéricas

Posted on marzo 30th, 2008 by baron

Los que se construyen a partir de las frecuencias se denominan diferenciales. Cuando se construyen a partir de las frecuencias acumuladas se denominan integrales. Hay una diferencia entre cómo se representan, en función de que la variable sea discreta o continua.

Histogramas

Posted on marzo 30th, 2008 by baron

Es el tipo de gráfico más importante para variables numéricas continuas. También se puede utilizar con variables discretas cuando presentan muchas modalidades.

Parámetros y estadísticos

Posted on abril 6th, 2008 by baron

Parámetros y estadísticos son medidas numéricas de resumen de la información contenida en poblaciones y muestras (respectivamente). Cuando un estadístico se utiliza con el objetivo de utilizar una muestra para calcular de modo aproximado el valor de un parámetro, se denomina estimador.

Los estadísticos los podemos dividir en varias categorías: posición (percentiles), centralización (media, mediana y moda), dispersión y forma (asimetría y curtosis).

Medidas de posición: percentiles

Posted on abril 6th, 2008 by baron

Las medidas de posición son los cuantiles y todas sus variantes: percentiles, terciles, cuartiles, quintiles, deciles,… Entre sus usos están:

  • Dividir a la población en conjuntos con número similar de individuos
  • Localizar observaciones muy bajas (o muy altas)

Diagrama de cajas de Tukey

Posted on abril 6th, 2008 by baron

Muestra los cuartiles (en realidad algo muy similar) y alguna información más. Nos permiten poder establecer comparaciones de variables numéricas (y ordinales) observadas en varios grupos. Son muy prácticos para identificar asociaciones entre variables numéricas y cualitativas.

Medidas de centralización: Media, mediana y moda

Posted on abril 6th, 2008 by baron

Dan una idea de hacia dónde se agrupan los datos.

El que se usa con mayor frecuencia es la media, aunque es preferible usar la mediana cuando los datos presentan observaciones anómalas o distribución asimétrica. La media muestral es el estadístico preferido cuando se utiliza como estimador de la media poblacional.

La moda no es de uso muy frecuente.

Cálculo manual de media y mediana

Posted on abril 6th, 2008 by baron

Ejemplo de cálculo de media y mediana. Sólo hay que verlo una vez en la vida. Normalmente nos lo hará el ordenador.

Fuentes de variabilidad

Posted on abril 6th, 2008 by baron

Al repetirse el experimento de observar a un individuo de una población se pueden dar diferentes resultados. Aquí mencionamos algunas de las fuentes de variabilidad.

Medidas de dispersión

Posted on abril 6th, 2008 by baron

Nos dan una idea de la densidad con la que se agrupan los datos alrededor del centro. Algunas de las más usadas son:

  • Rango: Distancia entre las observaciones mayor y menor.
  • Rango intercuartílico. Distancia entre los percentiles 25 y 75. Es como el rango, pero ignorando a las observaciones más extrañas, y quedándonos solamente con el 50% central de la distribución.
  • Desviación típica: Algo complicada de medir a primera vista, pero muy práctica en distribuciones aproximadamente normales, gracias a la “regla empírica” (el 95% de los datos se encuentran a menos de dos desviaciones típicas del centro).
  • Coeficiente de variación: Es la desviación típica, pero expresada de una forma ligeramente diferente. Nos indica cómo de grande es la desviación con respecto a la media.
  • Varianza: Es el cuadrado de la desviación típica. No se usa mucho fuera del entorno matemático.

En datos normales preferimos usar la desviación típica (acompañada por la media) para describir una muestra. En cualquier otro caso se suele mostrar el rango intercuartílico y/o el rango.

Asimetría

Posted on abril 6th, 2008 by baron

Un estadístico de asimetría nos indica si la distribución presenta una cola a alguno de los lados de la distribución.

Siendo la desviación normal muy importante en estadística, nos interesa describir las desviaciones de la normalidad. La distribución normal es simétrica, por tanto la asimetría es una indicación de falta de normalidad.

Apuntamiento o curtosis

Posted on abril 6th, 2008 by baron

El apuntamiento o curtosis mide el alejamiento de la normalidad basándose en cómo son de altas las colas de la distribución.

Cuando la distribución de los datos no presenta colas (los datos se distribuyen más o menos uniformemente en un intervalo) le corresponde un estadístico de curtosis con valor negativo.

Si la distribución presenta colas elevadas (lo que al representarse gráfiamente se suele ver como una zona central muy apuntada) le corresponde una curtosis de valor positivo.

Los valores de curtosis compatibles con la normalidad son los cercanos a cero.

Introducción a correlación y regresión

Posted on abril 9th, 2008 by baron

Una introducción a algunas ideas sobre correlación y regresión lineal.

Covarianza

Posted on abril 9th, 2008 by baron

La covarianza es una medida de la variabilidad conjunta de dos variables. Tiene interés en el desarrollo de la teoría, pero no se usa en la práctica directamente.

Coeficiente de correlación lineal de Pearson

Posted on abril 9th, 2008 by baron

Se utiliza muchísimo para describir la posible asociación lineal entre dos variables numéricas. Es el concepto que más claro hay que tener, junto al de bondad de ajuste, al tratar sobre correlación y regresión.

Regresión

Posted on abril 9th, 2008 by baron

Introducción a terminología sobre regresión: variable dependiente, independiente, residuo,…

Regresión lineal simple

Posted on abril 9th, 2008 by baron

El modelo de lineal simple es el modelo más sencillo de regresión. En él se utiliza a una variable independiente para predecir los valores de otra variable (dependiente). El modelo que se construye no es más que una recta. Las desviaciones con respecto a esa recta son los residuos del modelo.

Residuos

Posted on abril 9th, 2008 by baron

Los residuos son los errores cometidos al aproximar la variable dependiente por un modelo de regresión lineal. En término medio son nulos, pero lo interesante de ellos es su variabilidad, es decir su varianza. Cuando esta es muy grande (hay que precisar con respecto a qué), el modelo de regresión no es bueno.

Bondad de ajuste

Posted on abril 9th, 2008 by baron

Como medida de lo adecuado que es un ajuste de regresión, se utiliza una cantidad que se denota como  R2 y que también se denomina porcentaje de variabilidad explicado por el modelo de regresión, o coeficiente de determinación.

En principio si tengo una variable dependiente, su varianza es una medida de la incertudimbre que tenemos sobre sus valores al sacar a un individuo al azar.

Si el modelo de regresión es adecuado, debería ocurrir que al elegir a un individuo, si conocemos su valor de la variable independiente (X), la incertidumbre sobre su valor de Y disminuya. El porcentaje de disminución de esta incertidumbre (varianza) es precisamente la que se suele considerar como la medida de la bondad de un ajuste.

Ejemplo de estudio de regresión lineal

Posted on abril 9th, 2008 by baron

Un pequeño ejemplo de la salida que nos ofrece SPSS.

Clases Máster/Doctorado del martes 12/enero/2009 (y restantes)

Posted on enero 12th, 2009 by baron

Estimados estudiantes, seguimos con el problema de la falta de sillas en el aula oficial del curso, así que todas las clases que restan las haremos en el mismo lugar que las veces anteriores a partir de las 17:00, es decir, Aula de Informática de la Facultad de Filosofía y Letras.

Siento el inconveniente en empezar con una hora de retraso con repecto al horario previsto.

Resumen de prácticas de descriptiva con SPSS

Posted on enero 19th, 2009 by baron

Breve guía sobre cómo hacer con SPSS los cálculos más habituales para presentar un trabajo de descriptiva.

Uso de la tabla de la distribución Normal

Posted on enero 22nd, 2009 by baron

Este vídeo es para los estudiantes de Medicina…

He comprobado que se ha perdido parte del material que tenía preparado, así que en los próximos dias espero rehacer parte de él.

Este trata sobre el uso de la tabla de la distribución normal tipificada para hacer cálculos de probabilidad sobre cualquier otra distribución normal. La idea consiste en que puesto que todas las distribuciones normales son similares (salvo una traslación y cambio de escala), con saber calcular las probabilidades en una de ellas debería ser suficiente…

¿Y qué destribución más sencilla para aprender que aquella que tiene media cero y desviación uno?

Apuntes de las primeras sesiones

Posted on noviembre 7th, 2009 by baron

Vuestra compañera, Jessica Cazalilla, ha tenido el detalle de pasar sus notas de clase a limpio, con capturas de pantalla y gráficos incluídos.
Aquí tenéis sus apuntes.
¡Gracias Jessica!

Si queréis la versión un poquitín más ampliada, bajad estos documentos:

Uso de OpenOffice y Zotero para preparación de tesis

Posted on diciembre 20th, 2009 by baron

En la web de tecnología educativa de la UMA acaban de preparar material en vídeo de cómo preparar una tesis usando openoffice y zotero. Sois muchos los que me preguntásteis cómo hacerlo con openoffice, así que aquí está la respuesta.

Apuntes de introducción

Posted on mayo 25th, 2010 by baron

Notas de la clase de introducción.

Redactar la descriptiva de una variable

Posted on abril 10th, 2008 by baron

Esta es una pequeña guía sobre cómo presentar descriptivamente una variable en un trabajo.

Redactar la descriptiva de la relación entre dos variables

Posted on abril 10th, 2008 by baron

Cómo presentar las comparaciones descriptivas de una variable entre varios grupos, o de la relación entre dos variables numéricas. En algún caso se hace referencia a terminología de contrastes de hipótesis (no descriptivo). Esto se debe a qué es infrecuente presentar dichos resultados sin algo más de información.