XX
UMANTIC

Lead Data Scientist Deep Learning NLP H/F

  • +3
  • +11
  • FR
    Colombes, Île-de-France, France
Show interest
  • +3
  • +11
  • FR
    Colombes, Île-de-France, France

About

Contexte de la mission : Renforcer le Centre de Compétences Data Science de notre client final sur la partie NLP.


Tâches à réaliser :

  1. Aider le commanditaire à cadrer le projet en étant force de proposition.
  2. Accompagner techniquement des data scientists.
  3. Requêter les bases de données du client.
  4. Recenser et agréger les données de différentes sources.
  5. Analyser et explorer les données.
  6. Modéliser en s'appuyant sur des techniques de Machine Learning, Deep Learning.
  7. Automatiser et optimiser les traitements.
  8. Analyser les résultats produits pour s'assurer de la qualité des livrables.
  9. Produire des data visualisations si nécessaire et en minimisant les actions de maintenance que cela impliquerait par la suite.
  10. Restituer les résultats des travaux à l'écrit mais également à l'oral devant des commanditaires et en équipe, en apportant une plus-value dans l'analyse.
  11. Accompagner les commanditaires dans la prise en main des livrables.
  12. Documenter les travaux réalisés sur les aspects techniques et fonctionnels.
  13. Capitaliser et travailler en équipe dans une démarche de boucle d'amélioration.
  14. Utiliser les données en veillant au respect du RGPD.

Profil candidat :

Compétences recherchées :

Obligatoires :

  1. Capacité à accompagner techniquement des data scientists.
  2. Maîtrise de Python.
  3. Maîtrise des tâches de pré-traitement des données textuelles (parsing, expressions régulières, enrichissement (POS Tagging, dependency parsing), normalisation via lemmatisation ou stemming, correction orthographique).
  4. Compétences en apprentissage automatique sur des données textuelles via au moins l'un des domaines ci-dessous :
  1. Maîtrise des fondamentaux du Machine Learning : compréhension des concepts clés, des algorithmes et des méthodes d'évaluation.
  2. Expertise en Deep Learning : connaissance approfondie des architectures de réseaux de neurones, notamment les RNN, LSTM, GRU, et Transformers.
  3. Maîtrise des Frameworks de Deep Learning : expérience avec TensorFlow, PyTorch ou Keras.
  4. Connaissance des techniques « Transfer Learning » : expérience avec des modèles LLMs pré entraînés comme CamemBERT, GPT ou Mistral et leur fine-tuning pour des tâches spécifiques.
  5. Prompt engineering.
  1. Capacité à restituer et communiquer efficacement les résultats des travaux menés en data science.
  2. Appétence à l'innovation et à la veille technologique : capacité à rester à jour avec les dernières avancées en NLP.
  3. Proactivité et dynamisme pour piloter un projet de NLP avec des acteurs de profils variés.
  4. Encadrement d'analystes (délai, accompagnement technique, qualité).
  5. Expérience sur l'un ou plusieurs de ces cas d'usage :
  1. Classification multi-class / multi-label.
  2. Analyse de sentiment, opinion mining.
  3. Extraction d'entités nommées.
  4. Segmentation de texte.
  5. Similarité sur les données textuelles.
  6. Génération de texte : expérience d'utilisation de LLMs notamment dans des tâches de résumé automatique, synthèse, chatbot, etc.
  1. GitLab : connaissances de versionning et de partage de code (add, commit, push, pull, etc).
  2. Gestion de la donnée dans un contexte réglementaire RGPD/AI Act.
  3. MLOps : expérience avec des outils et des pratiques pour automatiser le cycle de vie du ML y compris l'intégration continue, le déploiement continu et la surveillance des modèles.
  4. Intégration et déploiement : capacité à intégrer ou packager des modèles entraînés pour les déployer à grande échelle.
  5. Aisance et rigueur.
#J-18808-Ljbffr

Nice-to-have skills

  • Python
  • Machine Learning
  • Deep Learning
  • LSTM
  • TensorFlow
  • PyTorch
  • Keras
  • Data Visualization
  • Gitlab
  • Integration
  • Deployment
  • Colombes, Île-de-France, France

Work experience

  • Machine Learning
  • NLP
  • Data Analyst

Languages

  • French