Entregar los scripts correspondientes a las defensas del 8 de agosto de 2023 a través de esta actividad.
Hay tiempo para mandar los scripts hasta el 3 de agosto a las 23:59 hs. No se podrá realizar la defensa si no se entrega el script.
Los scripts deben ser prolijos y estar comentados. Dentro del script, tiene que haber una muy breve descripción del problema (qué son los datos, qué significa cada variable, qué se quiere lograr). Además, tiene que figurar el nombre de los integrantes del grupo.
Presentación del curso y objetivos. Ronda de presentaciones.
Introducción a la visualización de datos usando ggplot2.
Facetas, otros tipos de geoms, gráficos que usan estadísticos de los datos.
Ajustes de posición y final de la parte de visualización. Comenzamos con las básicas de manejo de data frames usando dplyr.
Comandos básicos de dplyr.
Comando pipe y una muestra de las posibilidades de groupby/summarise.
Manejo combinado de filter y groupby.
Análisis exploratorio de datos: comportamiento de variables.
Covarianza entre variables.
Archivos csv para importación y exportación de datos.
Discusión sobre metodología para el informe final (minuto 1:08:30 hasta el final).
Datos ordenados (herramientas de tidyr). Comenzamos con datos relacionales.
Terminamos datos relacionales. Ejemplo de datos desordenados.
Fue la última clase siguiendo el libro "R para Ciencia de Datos".
Conceptos básicos de modelado (clase 1)
Conceptos básicos de modelado (clase 2)
Regresión lineal univariada (parte 1).
Regresión lineal univariada (parte 2).
Regresión multivariada (parte 1)
Regresión multivariada (parte 2).
Dejo un pequeño documento que define los criterios de Mallow's Cp, AIC, BIC y R^2 ajustado (fueron mencionados en clase, pero no definidos).
Además, al comienzo de la clase 18, emprolijo el setting de las cuentas del principio (varianza de beta gorro) que quedó desprolijo.
Regresión multivariada (parte 3) y método de máxima verosimilitud.
Regresión logística y modelos lineales generalizados.
Validación cruzada y bootstrap.
Regresión Ridge.
Regresión Lasso y Componentes Principales.
Script del capítulo 3 del libro 'R para Ciencia de Datos'.
- 19/8: Se sube la primer versión del archivo.
- 24/8: Actualización del archivo.
- 26/8: Actualización del archivo.
Script del capítulo 5 del libro "R para Ciencia de Datos".
- 29/8: primera versión del archivo
- 5/9: actualización
Script del capítulo 7 del libro "R para Ciencia de Datos"
- 5/9: primer versión del archivo
Script del capítulo 12 del libro "R para Ciencia de Datos"
14/9: primer versión
Script del tema "regresión lineal univariada", basado en parte del capítulo 3 del libro ISLR.
3/10: primer versión.
Script de regresión multivariada (capítulo 3 del libro ISLR).
26/10: primera versión
27/10: se agrega como armar fórmulas para interacciones entre predictores