Data Scientist Expert - IA
Le besoin
Mission Data Scientist Expert pour client secteur nucléaire.
L’objet de cette consultation est pour s’entourer de data scientists externes permettant l’analyse de besoin métier et le développement d’application IA (Intelligence Artificielle), ML (Machine Learning), DL (Deep Learning), IA GEN (Intelligence Artificielle Générative) .
· Périmètre de la consultation
· Prestations attendues
· Activités principales de data scientist
· Comprendre les cas d’usage
· Participer aux réunions de cadrage des besoins, avec le chef de projet DPIT
· Apporter son expertise, évaluer la pertinence de l’IA pour répondre au besoin
· Effectuer une première évaluation de l’effort nécessaire au développement d’une solution
· Réaliser des POC pour démontrer la faisabilité et la performance
· Collecte de Données
· Identification des Sources de Données : Reconnaître et identifier les sources de données pertinentes (internes et externes) pour les problèmes à résoudre.
· Extraction des Données : Récupérer les données à partir de diverses bases de données, API, fichiers texte, documents Word et PDF, web scraping, fichiers de données semi-structurées, etc.
· Préparation et Nettoyage des Données
· Nettoyage des Données : Corriger ou supprimer les données corrompues ou incorrectes, traiter les valeurs manquantes, éliminer les doublons.
· Transformation des Données : Convertir et normaliser les données pour rendre les formats compatibles, et effectuer des transformations telles que la mise à l'échelle et la codification catégorielle.
· Ingénierie des Caractéristiques : Extraire, créer et sélectionner des caractéristiques pertinentes (features) à partir des données brutes.
· Traitement du Langage Naturel : Extraire, nettoyer et transformer des verbatims issus de documentations non structurées
· Exploration et Visualisation des Données
· Analyse Exploratoire des Données (EDA) : Utiliser des techniques statistiques et des outils de visualisation pour comprendre les distributions, les relations et les anomalies dans les données.
· Détection de Motifs et de Tendances : Identifier des modèles récurrents, des corrélations et des tendances pour formuler des hypothèses et des relations causales potentielles.
· Modélisation, Développement et Utilisation de Modèles
· Utilisation du langage python pour développer les applications nécessaires, ainsi que des interfaces utilisateur de premier niveau
· Sélection d'Algorithmes : Choisir les algorithmes d'apprentissage machine (Machine Learning) ou d'apprentissage profond (Deep Learning) les plus appropriés pour le problème.
· Entraînement des Modèles : Former les modèles en utilisant des ensembles de données d'entraînement et ajuster les paramètres pour optimiser les performances
· Validation des Modèles : Utiliser des techniques de validation croisée pour évaluer la robustesse des modèles et éviter le surajustement (overfitting).
· Instancier des modèles de langages pré-entraînés (LLMs, embeddings, Rerankers…) et les intégrer dans des solutions complexes type RAG (Retrieval Augmented Generation).
· Maitrise des principales bibliothèques Python d’analyse de données et d’IA :
· Manipulation de données : Pandas et Polars, Dask et/ou PySpark
· Traitement du Langage Naturel : NLTK et/ou Spacy
· Machine Learning : Scikit-Learn, XGBoost, LightGBM
· Deep Learning : PyTorch
· IA générative : Ollama, Transformers, SentenceTransformers et Langchain et/ou LlamaIndex
· Évaluation des Modèles
· Métriques de Performance : Évaluer les performances des modèles à l'aide de diverses métriques comme la précision, le rappel, le score F1, l'AUC-ROC, Matthews, RMSE, MAE, R2-Score, MAPE, Silhouette etc.
· Analyse des Erreurs : Analyser les erreurs de prédiction pour comprendre les faiblesses des modèles et identifier des pistes d'amélioration.
· Déploiement des Modèles
· Intégration des Modèles : Collaborer avec les équipes d'ingénierie et de développement pour intégrer les modèles dans les systèmes de production.
· Automatisation des Flux de Travail : Créer et automatiser des pipelines de données pour assurer un flux continu de données du stockage à l'inférence.
· Développement d'API : Créer des interfaces de programmation d’applications (API) pour permettre l'accès aux modèles par d'autres systèmes ou utilisateurs.
· Surveillance et Maintenance des Modèles
· Surveillance des Performances : Mettre en place des mécanismes pour surveiller les performances des modèles en production et détecter toute dégradation.
· Réentraînement des Modèles : Effectuer des mises à jour et réentraîner les modèles régulièrement pour maintenir leur performance face à des nouvelles données et des changements dans les patterns des données.
· Documentation et Communication
· Documentation Technique : Documenter les processus, les méthodologies, les décisions de conception et les résultats des modèles.
· Communication des Résultats : Présenter les insights et les résultats aux parties prenantes, en utilisant des visualisations claires et des mots accessibles aux non-experts.
· Rapports et Présentations : Rédiger des rapports et préparer des présentations pour partager les découvertes et les recommandations.
· Recherche et Développement
· Veille Technologique : Rester informé des dernières avancées en matière d'algorithmes, de techniques d'apprentissage machine et d'outils.
· Prototypage et Expérimentation : Concevoir et tester de nouveaux modèles et approches pour résoudre des problèmes complexes ou améliorer les performances.
· Collaboration
· Collaboration Interdisciplinaire : Travailler avec des experts de domaine, des analystes métier et d'autres parties prenantes pour comprendre les besoins et les contraintes spécifiques.
Présence sur site 2-3J Lyon
Démarrage Septembre
NF
Emplois Recommandés
Représentant commercial adidas - Sud-Est (H/F/D)
Représentant Commercial - adidas H/F/D Zone Sud-est : basé à Lyon ou Avignon Vous serez en charge de relayer et de mettre en œuvre la stratégie d'adidas auprès de nos grands comptes sur votr…
CUSTOMER SERVICE (H/F)
FAB Group, cabinet de recrutement spécialisé et à forte croissance, recrute pour le compte de son client un CUSTOMER SERVICE (H/F) basée à Lyon . L'entreprise qui recrute ? Une société spéci…
Alternance - Responsable de rayon (H/F)
STUDI, l’école n°1 de la formation 100 % en ligne , recherche pour son entreprise partenaire, un Responsable de rayon (H/F) en contrat d’apprentissage. Lancez votre carrière dès à présent en s…
Gestionnaire de Données Produits (h/f)
Description de l'offre Description de l’offre Votre mission ADECCO LYON TERTIAIRE recherche pour son client, un groupe international spécialisée dans la distribution de solutions et service…
Technicien vendeur cycle H/F (H/F)
Rôle : Garantir l'entretien courant, diagnostiquer les dysfonctionnements pour détecter d'éventuelles pièces défectueuses et réparer les cycles en estimant le temps et le coût nécessaires aux réparat…
Key account manager H/F - Industrie
Rattaché au responsable des ventes, avec un secteur géographique national, le poste comporte deux axes de travail principaux : Externe et interne En externe, vos responsabilités seront axées sur deux…
Stagiaire Assistant Brand Activation France
Mission Babolat est une saga familiale dont l'histoire avec le sport démarre en 1875, au même moment que la naissance du tennis et du badminton. La marque lyonnaise est née et a construit son exp…
Responsable technique - CDI
Description de l'entreprise Promoteur originaire du Touquet et fondé dans les années 80, le Groupe Edouard Denis place au premier plan le savoir-faire et la qualité. D’abord spécialisé dans l’imm…
Développeur PHP Symfony
La société: Cette start up développe la solution d’apprentissage de demain en digital learning, adaptée au quotidien des soignants, du médecin à l’infirmier, à jour des dernières connaissances scien…
Commercial IRVE (H/F)
Êtes-vous prêt pour un nouveau défi ? Entreprise toulousaine innovante et en forte croissance, nous proposons à nos clients tous les services liés à la mobilité électrique.L’entreprise a développé t…