Actividades Académicas - Materias

 

Materia 7-105: Introducción a Big Data y Machine Learning.

 

Temario

Objetivo: Describir las principales herramientas del análisis de datos, utilizando métodos estadísticos tradicionales y técnicas recientes de aprendizaje automático supervisado y no supervisado, de manera que el participante pueda detectar oportunidades de aplicación en sus tareas diarias y las de sus clientes, pudiendo participar en la solución de las mismas. La adaptación de breves casos reales evaluados con el software libre RStudio, también permitirá conocer cómo se pueden implementar estas técnicas. Estos datos, cuyo detalle puede verse en el Cronograma del Curso, están referidos entre otros al valor de una vivienda según las características del barrio (Boston), salario de beisbolistas en función de su antigüedad en grandes ligas (USA 1986/7), predicción de suba o baja del mercado accionario (S&P500), consumo de combustible en función de las características de un auto (USA 1970/82), arrestos según tipo de crimen y población urbana (USA 1973) y datos genéticos de pacientes con cáncer (NCI60)

Contenido:- Descripción general del Aprendizaje Automático y sus técnicas estadísticas y computacionales. Calidad del Ajuste y Trade-off sesgo-varianza. - Modelo Lineal de Regresión: Predicción, selección y bondad de ajuste. Regresión No Lineal y variables dummys. - Clasificación: Regresión Logística y Análisis Discriminante lineal y cuadrático. Método de K-Nearest Neighbors. Breve comparación de resultados. - Métodos de muestreo: Cross-Validation y Bootstrap. Aplicación en confección de modelos. - Métodos Avanzados: Ridge Regression y técnica Lasso. Regresiones polinomiales y Splines. Otros - Aprendizaje No Supervisado: Árboles, Componentes Principales y Clustering - Aplicaciones con RStudio.

Requisitos: Profesionales de Ciencias Económicas interesados en conocer las herramientas y terminología básica aplicada en el análisis de datos mediante las técnicas de aprendizaje estadístico.

Duración: 9