En este curso se introducen las técnicas más comunes de machine learning tradicional. Trabajamos sobre conjuntos de datos de interés público. Todos los ejemplos están programados en Python utilizando scikit-learn y otras librerías populares. Todas las clases están acompañadas por videos explicativos en Youtube.
Cada Jupyter se puede ejecutar de manera local usando el programa Jupyter Notebook que viene con la distribución de Python conocida como Anaconda. Recomendamos que intenten instalarse esta distribución ya que es estándar su uso en la industria. Para hacerlo puede hacer clic en downloads acá: https://www.anaconda.com/products/individual
Alternativamente, cada notebook incluye un botón para abrir en Google Colab, el cual es un producto gratuito de Google, es una Jupyter Notebook en la nube. El botón lo pueden encontrar al comienzo de cada clase. Finalmente, también incluímos acá las rutas a las que redirige ese botón, que es https://colab.research.google.com + la ruta en github.
1_Introducción a Machine Learning + Regresión Lineal Simple:
- Aprendizaje supervisado y no supervisado.
- Algoritmos paramétricos y no paramétricos.
- Train/test split y cross validation.
- Information leak, corte transversal, series temp. y datos de panel.
- Regresion lineal simple
Video: https://www.youtube.com/watch?v=FuIlgsbPr9E&list=PLISuMnTdVU-zF4QLEKnLvNVHb7N_wHCp0
2 Regresión Lineal Múltiple:
- Modelo de Regresión Lineal Múltiple.
- Estimación e interpretación de los parámetros.
- Variables categóricas.
- Evaluación del modelo.
- Diagnóstico del modelo
Video: https://www.youtube.com/watch?v=7W43HBXt9Cs&list=PLISuMnTdVU-wuxD7ubJD8rc29MkDy9bWo
3 Regularización:
- Regularización
- Optimización
- Feature Engineering
- Pipelines
Video: https://www.youtube.com/watch?v=ETyIMqHoP9g&list=PLISuMnTdVU-xexTl51UbNu30myaUsaa3R
4 Clasificación:
- Limitaciones de la Regresión Lineal
- Regresión Logística
- Interpretación
- Métricas de evaluación
Video: https://www.youtube.com/watch?v=qW9qC1zstwc&list=PLISuMnTdVU-zvmwe88-8yvbJWoRgpCriR
5 KNN y Árboles de Decisión
- Modelos paramétricos vs. no paramétricos
- K-vecinos más cercanos
- Árboles de decisión para clasificación
- Árboles de decisión para regresión
Video: https://www.youtube.com/watch?v=d9Z1F04uETk&list=PLISuMnTdVU-wzYasgzs3n76FY3eJNdja8
6 Ensambles
- Bagging
- Random Forests
- Extratrees
- Boosting
-AdaBoost
-Grandient Boosting Trees
7 XGBoost
- XGBoost
- LightGBM
- CatBoost
- NGBoost
- Pipelines
Video: https://youtube.com/playlist?list=PLISuMnTdVU-x19YIy1umdmekra28VToSv
8 SHAP y ANOMALIAS
- Detección de anomalías
- Técnicas de exploración
- Isolation forest
- Explicabilidad de modelos
- Feature Importance
- Shap values
Video: https://www.youtube.com/watch?v=a4uHGK4nW-0&list=PLISuMnTdVU-zxuEhD2Wtg8depk_ZXfWhU
9 Series de tiempo
- ETS
- ARIMA
- Prophet
- Time series cross validation y métricas de error
Código:
Video: https://www.youtube.com/watch?v=TeG-Ut8ftrw&list=PLISuMnTdVU-wJ4nvYFjji2EGlONuOwfVg
10 Sistemas de Recomendación