BI6-R intermedio

Área: Bioestadística y paquetes de análisis estadístico Fecha: 27 a 31 de julio 2020
Duración:  20 horas Costo: $6,550.00 MN
Horario: 10:00 a 14:00 hrs. Sede: Ciudad de México. Instalaciones de INSP.

Docentes

Da clic sobre el docente para ver su cápsula
Descripción:

Requisitos y/o Perfil del Alumno

El curso está orientado hacia profesionales de la salud, así como al público en general con un fuerte interés en el software y con conocimientos básicos como la creación de modelos de simulación epidemiológica; particularmente en modelos de Markov y su implementación en el software R. No se requiere previa experiencia de programación ni de modelado matemático. Conocimientos básicos de estadística (media, desviación estándar) son sugeridos.

Una computadora con R versión mayor a 3.5.0 instalado y con RStudio versión mayor a 1.2.5 o bien una cuenta en RStudio Cloud (https://rstudio.cloud). El sistema operativo puede ser: Windows, IOS (Mac), Linux o Solaris.

Conocimientos básicos de computación: generar archivos en Microsoft Office (Word y Excel), descomprimir archivos .zip, descargar archivos e información de Internet.

(Sugerido) Lectura en inglés (para la bibliografía).

Introducción

Pendiente

Objetivo general

Conocer y manejar apropiadamente las herramientas para análisis estadístico de encuestas de diseño complejo.

Conocer, aplicar e interpretar los modelos estadísticos mas comunes incluyendo: regresiones lineales, regresiones logísticas, regresiones Poisson así como las distintas medidas para el ajuste.

Conocer, aplicar e interpretar métodos básicos de aprendizaje de máquina incluyendo agrupación (clustering), bosques aleatorios (random forests) y redes neuronales (neural networks) así como evaluar su ajuste.

Metodología

El curso se imparte de manera presencial a lo largo de una semana (4 horas diarias). Las sesiones consisten en exposición del material por parte del docente (1 hora 50 minutos), ejercicios guiados grupales (55 minutos) así como ejercicios individuales (55 minutos). Se darán descansos de 10 minutos por cada hora y media de clase. Durante cada sesión serán asignadas tareas adicionales; éstas serán revisadas y discutidas de manera individual. Cada día se repartirán notas de lo visto en clase.

Contenido temático preliminar

  1. Introducción teórica a las encuestas con diseño complejo.
  2. Utilización del paquete survey para estimación.
  3. Regresiones:

  • Regresión lineal y herramientas de diagnóstico (residuales, Cook, apalancamiento, etc).

  • Regresión logística y Poisson junto con herramientas de diagnóstico (validación cruzada).

  • Regresión no paramétrica (kernel) y regresiones locales (splines, lowess, etc).

  1. Fundamentos de aprendizaje de máquina:
    1. Problemas de agrupación y de regresión
    2. Aprendizaje supervisado y no supervisado
    3. Bosques aleatorios
    4. Agrupación mediante K medias y máquinas de soporte vectorial
    5. Redes neuronales artificiales

Criterios de acreditación

Para acreditar el curso se requiere cumplir con un mínimo de asistencia del 80% de las sesiones (16 horas). La evaluación se realizará de la siguiente forma:

• Ejercicios individuales en clase (60%).

• Tareas (40%).

Reconocimiento

Se otorgará constancia de acreditación a los alumnos que cumplan con los requisitos antes señalados.

No hay traducción para la descripción de este curso / There is not description