
Profil Professionnel
Je suis Data Scientist et Ingénieur Statisticien, avec de solides bases en statistiques, probabilités, optimisation et économétrie.
Je conçois des solutions de machine learning pour la modélisation prédictive — notamment pour l’évaluation du risque de chômage de longue durée, l’analyse du churn, le traitement du langage naturel (NLP), l’analyse de données à grande dimension, et la maintenance prédictive (RUL). Je réalise également des enquêtes et des analyses statistiques pour des applications variées, et j’ai mené des projets intégrant le déploiement de modèles (MLOps) et des solutions cloud avec AWS.
Technologies : Python, SQL, scikit-learn, TensorFlow, Keras, PyTorch, Spark, AWS, Docker, FastAPI, Flask, Streamlit, R, SAS, Shiny, Power BI.
Projets
Voici quelques-uns de mes projets en machine learning, cloud et analyse de données.
Scores de Bonheur – Modèles Linéaires Mixtes
Analyse des données du World Happiness Report (2015–2023) utilisant des modèles linéaires mixtes pour estimer les effets fixes (PIB, espérance de vie, etc.) et les effets aléatoires (intercept et tendances par pays).
API de Détection d’Objets YOLOv5
API REST développée avec FastAPI et YOLOv5 pour la détection d’objets sur images, conteneurisée avec Docker, tests automatisés et interface Swagger.
Prédiction de la Durée de Vie Restante
Solution de maintenance prédictive de bout en bout pour turbofan : ingestion et prétraitement des données NASA CMAPSS FD001, ingénierie de caractéristiques temporelles, entraînement d’un modèle LightGBM pour la prédiction de la Durée de Vie Restante (RUL), et dashboard interactif pour le suivi & diagnostics (distribution d’erreurs, jauge de cycle de vie, explicabilité SHAP) via Streamlit.
Tableau de Bord World Happiness
Tableau de bord Shiny interactif utilisant les données du World Happiness Report (2015–2023), avec analyses des tendances mondiales, profils par pays et modélisation prédictive.
Exercices de Machine Learning sur AWS
Implémentations pratiques des services IA d’AWS : Rekognition pour l’étiquetage d’images, Textract pour l’extraction de textes, Comprehend pour l’analyse de sentiments, Transcribe & Translate pour l’audio, et Lex pour les chatbots conversationnels.
Filmalyze
Tableau de bord Streamlit pour la découverte de films : traitement d’un dataset Kaggle de 10 000 films pour explorer par genre, année, note et recettes, générer des recommandations personnalisées et visualiser les tendances de notes et de box‑office.
Vous souhaitez en voir plus ? Découvrez d'autres projets sur mon GitHub.
Mon Parcours
Formation
Master – Statistique pour l'Évaluation et la Prévision
Sep 2024 – Sep 2026
Université de Reims Champagne-Ardenne, France
Diplôme d’Ingénieur – Statistique et Informatique Décisionnelle
2018 – 2022
École Nationale de la Statistique et de l'Analyse Économique, Sénégal
Langues
- Français – Langue maternelle
- Anglais – B2
- Wolof – Langue maternelle
Certifications
- AWS Cloud Practitioner Essentials – AWS (2025)
- Introduction to Machine Learning on AWS – AWS (2025)
- Machine Learning in Production – DeepLearning.AI (2025)
- SAS Certified Specialist: Base Programming Using SAS 9.4 – SAS (2025)
Expérience Professionnelle
Chargé d’Études Statistiques
ANSD, Sénégal (Août 2022 – Juil. 2024)
- Pilotage de projets data et enquêtes d’entreprises : enquête de mise à jour du CUCI, apurement du RNEA, migration vers NINEAWEB.
- Analyse de la démographie des entreprises et appui au changement d’année de base des comptes nationaux.
- Traitement des requêtes liées aux répertoires d’entreprises (CUCI, RNEA, RGE).
Outils : Python, R, Stata, Excel, QGIS, Survey Solutions
Stagiaire Data Scientist
ANSD, Sénégal (Mars 2022 – Juil. 2022)
- Développement de modèles prédictifs pour évaluer le risque de chômage de longue durée.
- Création d’une application web interactive sous Shiny pour le profilage et la visualisation des profils de risque.
Outils : R, Shiny, Stata, Excel
Stagiaire Data Analyst
ANSD, Sénégal (Sep. 2021 – Nov. 2021)
- Analyse des facteurs socio-démographiques liés à l’usage de la contraception chez les jeunes femmes.
- Propositions pour améliorer l’accès aux services de contraception.
Outils : R, Stata, Excel
Spécialiste des données de terrain
ENSAE, Sénégal (Août 2021 – Oct. 2021)
- Conception d’outils de collecte ODK et formation des équipes de terrain.
- Supervision d’une enquête nationale sur les impacts de la COVID-19 auprès des entreprises et ménages.
Outils : ODK, XLSForm