Skip to content

Latest commit

 

History

History
 
 

Machine Learning

En este curso se introducen las técnicas más comunes de machine learning tradicional. Trabajamos sobre conjuntos de datos de interés público. Todos los ejemplos están programados en Python utilizando scikit-learn y otras librerías populares. Todas las clases están acompañadas por videos explicativos en Youtube.

Cada Jupyter se puede ejecutar de manera local usando el programa Jupyter Notebook que viene con la distribución de Python conocida como Anaconda. Recomendamos que intenten instalarse esta distribución ya que es estándar su uso en la industria. Para hacerlo puede hacer clic en downloads acá: https://www.anaconda.com/products/individual

Alternativamente, cada notebook incluye un botón para abrir en Google Colab, el cual es un producto gratuito de Google, es una Jupyter Notebook en la nube. El botón lo pueden encontrar al comienzo de cada clase. Finalmente, también incluímos acá las rutas a las que redirige ese botón, que es https://colab.research.google.com + la ruta en github.

1_Introducción a Machine Learning + Regresión Lineal Simple:

  • Aprendizaje supervisado y no supervisado.
  • Algoritmos paramétricos y no paramétricos.
  • Train/test split y cross validation.
  • Information leak, corte transversal, series temp. y datos de panel.
  • Regresion lineal simple

Código: https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/1_Introduccion/rls.ipynb

Video: https://www.youtube.com/watch?v=FuIlgsbPr9E&list=PLISuMnTdVU-zF4QLEKnLvNVHb7N_wHCp0

2 Regresión Lineal Múltiple:

  • Modelo de Regresión Lineal Múltiple.
  • Estimación e interpretación de los parámetros.
  • Variables categóricas.
  • Evaluación del modelo.
  • Diagnóstico del modelo

Video: https://www.youtube.com/watch?v=7W43HBXt9Cs&list=PLISuMnTdVU-wuxD7ubJD8rc29MkDy9bWo

3 Regularización:

  • Regularización
  • Optimización
  • Feature Engineering
  • Pipelines

Código: https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/3_Regularizacion/Regularizacion.ipynb

Video: https://www.youtube.com/watch?v=ETyIMqHoP9g&list=PLISuMnTdVU-xexTl51UbNu30myaUsaa3R

4 Clasificación:

  • Limitaciones de la Regresión Lineal
  • Regresión Logística
  • Interpretación
  • Métricas de evaluación

Código: https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/4_Clasificacion/Clasificacion.ipynb

Video: https://www.youtube.com/watch?v=qW9qC1zstwc&list=PLISuMnTdVU-zvmwe88-8yvbJWoRgpCriR

5 KNN y Árboles de Decisión

  • Modelos paramétricos vs. no paramétricos
  • K-vecinos más cercanos
  • Árboles de decisión para clasificación
  • Árboles de decisión para regresión

Código: https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/5_KNNyArbolesDeDecision/KNN_Arboles.ipynb

Video: https://www.youtube.com/watch?v=d9Z1F04uETk&list=PLISuMnTdVU-wzYasgzs3n76FY3eJNdja8

6 Ensambles

  • Bagging
    • Random Forests
    • Extratrees
  • Boosting
    -AdaBoost
    -Grandient Boosting Trees

Código: https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/6_Ensamble/Bagging%26Boosting.ipynb

Video: https://www.youtube.com/watch?v=YAOzh2pTAy4&list=PLISuMnTdVU-x13FA77cV5cr4OMoOPT6MZ&ab_channel=InstitutoHumai

7 XGBoost

  • XGBoost
  • LightGBM
  • CatBoost
  • NGBoost
  • Pipelines

Código: https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/7_XGBoost/xgboost.ipynb

Video: https://youtube.com/playlist?list=PLISuMnTdVU-x19YIy1umdmekra28VToSv

8 SHAP y ANOMALIAS

  • Detección de anomalías
    • Técnicas de exploración
    • Isolation forest
  • Explicabilidad de modelos
    • Feature Importance
    • Shap values

Código: https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/8_ShapyAnomalias/anomaly-detection-shap-values.ipynb

Video: https://www.youtube.com/watch?v=a4uHGK4nW-0&list=PLISuMnTdVU-zxuEhD2Wtg8depk_ZXfWhU

9 Series de tiempo

  • ETS
  • ARIMA
  • Prophet
  • Time series cross validation y métricas de error

Código:

https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/9_SeriesDeTiempo/1.ARIMA.ipynb

https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/9_SeriesDeTiempo/2.Prophet.ipynb

Video: https://www.youtube.com/watch?v=TeG-Ut8ftrw&list=PLISuMnTdVU-wJ4nvYFjji2EGlONuOwfVg

10 Sistemas de Recomendación

Código: https://colab.research.google.com/github/institutohumai/cursos-python/blob/master/MachineLearning/10_Recomendacion/sistemas_recomendacion.ipynb

Video 1: https://www.youtube.com/watch?v=9KWVIZJfm8Q

Video 2: https://www.youtube.com/watch?v=d-MiHa4cRqo