Section outline

    • Presentación del curso y objetivos. Ronda de presentaciones.

    • Introducción a la visualización de datos usando ggplot2.

    • Facetas, otros tipos de geoms, gráficos que usan estadísticos de los datos.

    • Ajustes de posición y final de la parte de visualización. Comenzamos con las básicas de manejo de data frames usando dplyr.

    • Comandos básicos de dplyr.

    • Comando pipe y una muestra de las posibilidades de groupby/summarise.

    • Manejo combinado de filter y groupby.

    • Análisis exploratorio de datos: comportamiento de variables.

    • Covarianza entre variables.
      Archivos csv para importación y exportación de datos.
      Discusión sobre metodología para el informe final (minuto 1:08:30 hasta el final).

    • Datos ordenados (herramientas de tidyr). Comenzamos con datos relacionales.

    • Terminamos datos relacionales. Ejemplo de datos desordenados.

      Fue la última clase siguiendo el libro "R para Ciencia de Datos".

    • Conceptos básicos de modelado (clase 1)

    • Conceptos básicos de modelado (clase 2)

    • Regresión multivariada (parte 2).
      Dejo un pequeño documento que define los criterios de Mallow's Cp, AIC, BIC y R^2 ajustado (fueron mencionados en clase, pero no definidos).
      Además, al comienzo de la clase 18, emprolijo el setting de las cuentas del principio (varianza de beta gorro) que quedó desprolijo.

    • Regresión multivariada (parte 3) y método de máxima verosimilitud.

    • Regresión logística y modelos lineales generalizados.

    • Validación cruzada y bootstrap.

    • Regresión Ridge.

    • Regresión Lasso y Componentes Principales.