2.12.12 (628)

Enseignement spécifique des masters - APM_53678_EP : Data Camp

Descriptif

Day 1: Data wrangling

- Advanced course on Pandas
- Tidy data
- Lab on MovieLens dataset
- Challenge and getting started with RAMP

Day 2: ML Pipelines and hyperparameter search

- Column transformer and pipelines
- Bayesian optimization and hyper parameter search
- Learning curves

Day 3: Metrics and dealing with unbalanced data

- Presentation of the different ML metrics
- Problem of the metric with unbalanced data
- ML approaches to deal with imbalanced data

Day 4: Ensemble methods and feature engineering

- Gradient Boosting
- Stacking
- feature engineering

Day 5: Model inspection

- partial dependence plots
- feature importance

Challenges

Besides the students will compete during the week on a data challenge.

Format des notes

Numérique sur 20

Pour les étudiants du diplôme Inside ENSTA Paris

Pour les étudiants du diplôme Diplôme d'Ingénieur de l'Ecole Nationale Supérieure de Techniques Avancées

Pour les étudiants du diplôme Master 2 Data Sciences

Le rattrapage est autorisé (Note de rattrapage conservée)
  • le rattrapage est obligatoire si :
    Note initiale < 7
  • le rattrapage peut être demandé par l'étudiant si :
    7 ≤ note initiale < 10
L'UE est acquise si Note finale >= 10
  • Crédits ECTS acquis : 4 ECTS

Le coefficient de l'UE est : 3

Veuillez patienter