Grabaciones
Section outline
-
-
Presentación del curso y objetivos. Ronda de presentaciones.
-
Introducción a la visualización de datos usando ggplot2.
-
Facetas, otros tipos de geoms, gráficos que usan estadísticos de los datos.
-
Ajustes de posición y final de la parte de visualización. Comenzamos con las básicas de manejo de data frames usando dplyr.
-
Comandos básicos de dplyr.
-
Comando pipe y una muestra de las posibilidades de groupby/summarise.
-
Manejo combinado de filter y groupby.
-
Análisis exploratorio de datos: comportamiento de variables.
-
Covarianza entre variables.
Archivos csv para importación y exportación de datos.
Discusión sobre metodología para el informe final (minuto 1:08:30 hasta el final). -
Datos ordenados (herramientas de tidyr). Comenzamos con datos relacionales.
-
Terminamos datos relacionales. Ejemplo de datos desordenados.
Fue la última clase siguiendo el libro "R para Ciencia de Datos".
-
Conceptos básicos de modelado (clase 1)
-
Conceptos básicos de modelado (clase 2)
-
Regresión lineal univariada (parte 1).
-
Regresión lineal univariada (parte 2).
-
Regresión multivariada (parte 1)
-
Regresión multivariada (parte 2).
Dejo un pequeño documento que define los criterios de Mallow's Cp, AIC, BIC y R^2 ajustado (fueron mencionados en clase, pero no definidos).
Además, al comienzo de la clase 18, emprolijo el setting de las cuentas del principio (varianza de beta gorro) que quedó desprolijo. -
Regresión multivariada (parte 3) y método de máxima verosimilitud.
-
Regresión logística y modelos lineales generalizados.
-
Validación cruzada y bootstrap.
-
Regresión Ridge.
-
Regresión Lasso y Componentes Principales.
-