Profil Professionnel

Je suis Data Scientist et Ingénieur Statisticien, avec de solides bases en statistiques, probabilités, optimisation et économétrie.

Je conçois des solutions de machine learning pour la modélisation prédictive — notamment pour l’évaluation du risque de chômage de longue durée, l’analyse du churn, le traitement du langage naturel (NLP), l’analyse de données à grande dimension, et la maintenance prédictive (RUL). Je réalise également des enquêtes et des analyses statistiques pour des applications variées, et j’ai mené des projets intégrant le déploiement de modèles (MLOps) et des solutions cloud avec AWS.

Technologies : Python, SQL, scikit-learn, TensorFlow, Keras, PyTorch, Spark, AWS, Docker, FastAPI, Flask, Streamlit, R, SAS, Shiny, Power BI.

Projets

Voici quelques-uns de mes projets en machine learning, cloud et analyse de données.

Scores de Bonheur – Modèles Linéaires Mixtes

Analyse des données du World Happiness Report (2015–2023) utilisant des modèles linéaires mixtes pour estimer les effets fixes (PIB, espérance de vie, etc.) et les effets aléatoires (intercept et tendances par pays).

Outils : R, lme4, lmerTest, ggplot2, tidyverse, Quarto, GitHub Pages

API de Détection d’Objets YOLOv5

API REST développée avec FastAPI et YOLOv5 pour la détection d’objets sur images, conteneurisée avec Docker, tests automatisés et interface Swagger.

Outils : Python, FastAPI, YOLOv5, Docker, Pytest, Uvicorn

Prédiction de la Durée de Vie Restante

Solution de maintenance prédictive de bout en bout pour turbofan : ingestion et prétraitement des données NASA CMAPSS FD001, ingénierie de caractéristiques temporelles, entraînement d’un modèle LightGBM pour la prédiction de la Durée de Vie Restante (RUL), et dashboard interactif pour le suivi & diagnostics (distribution d’erreurs, jauge de cycle de vie, explicabilité SHAP) via Streamlit.

Outils : Python, Pandas, scikit‑learn, LightGBM, Optuna, SHAP, Streamlit, Altair

Tableau de Bord World Happiness

Tableau de bord Shiny interactif utilisant les données du World Happiness Report (2015–2023), avec analyses des tendances mondiales, profils par pays et modélisation prédictive.

Outils : R, Shiny, ggplot2, leaflet, plotly, FactoMineR

Exercices de Machine Learning sur AWS

Implémentations pratiques des services IA d’AWS : Rekognition pour l’étiquetage d’images, Textract pour l’extraction de textes, Comprehend pour l’analyse de sentiments, Transcribe & Translate pour l’audio, et Lex pour les chatbots conversationnels.

Outils : Python, AWS CLI, Boto3, Rekognition, Textract, Comprehend, Transcribe, Translate, Lex

Filmalyze

Tableau de bord Streamlit pour la découverte de films : traitement d’un dataset Kaggle de 10 000 films pour explorer par genre, année, note et recettes, générer des recommandations personnalisées et visualiser les tendances de notes et de box‑office.

Outils : matplotlib, seaborn, pandas, numpy, plotly, streamlit

Vous souhaitez en voir plus ? Découvrez d'autres projets sur mon GitHub.

Mon Parcours

Formation

Master – Statistique pour l'Évaluation et la Prévision

Sep 2024 – Sep 2026

Université de Reims Champagne-Ardenne, France

Diplôme d’Ingénieur – Statistique et Informatique Décisionnelle

2018 – 2022

École Nationale de la Statistique et de l'Analyse Économique, Sénégal

Langues

  • Français – Langue maternelle
  • Anglais – B2
  • Wolof – Langue maternelle

Certifications

  • AWS Cloud Practitioner Essentials – AWS (2025)
  • Introduction to Machine Learning on AWS – AWS (2025)
  • Machine Learning in Production – DeepLearning.AI (2025)
  • SAS Certified Specialist: Base Programming Using SAS 9.4 – SAS (2025)

Expérience Professionnelle

Chargé d’Études Statistiques

ANSD, Sénégal (Août 2022 – Juil. 2024)
  • Pilotage de projets data et enquêtes d’entreprises : enquête de mise à jour du CUCI, apurement du RNEA, migration vers NINEAWEB.
  • Analyse de la démographie des entreprises et appui au changement d’année de base des comptes nationaux.
  • Traitement des requêtes liées aux répertoires d’entreprises (CUCI, RNEA, RGE).

Outils : Python, R, Stata, Excel, QGIS, Survey Solutions

Stagiaire Data Scientist

ANSD, Sénégal (Mars 2022 – Juil. 2022)
  • Développement de modèles prédictifs pour évaluer le risque de chômage de longue durée.
  • Création d’une application web interactive sous Shiny pour le profilage et la visualisation des profils de risque.

Outils : R, Shiny, Stata, Excel

Stagiaire Data Analyst

ANSD, Sénégal (Sep. 2021 – Nov. 2021)
  • Analyse des facteurs socio-démographiques liés à l’usage de la contraception chez les jeunes femmes.
  • Propositions pour améliorer l’accès aux services de contraception.

Outils : R, Stata, Excel

Spécialiste des données de terrain

ENSAE, Sénégal (Août 2021 – Oct. 2021)
  • Conception d’outils de collecte ODK et formation des équipes de terrain.
  • Supervision d’une enquête nationale sur les impacts de la COVID-19 auprès des entreprises et ménages.

Outils : ODK, XLSForm

Contactons-nous

Intéressé par une collaboration ou un projet ? N'hésitez pas à me contacter.