ST21/148 – Stage – Data Scientist H/F

  • CDI
  • N'importe où
  • Publié il y a 4 semaines

Famille Métier : Stratégie / Innovation/Data et décisionnel
Contrat : Stage
Description du poste :
L’équipe Le Big Data Lab de la Direction Stratégie est en charge des traitements analytiques avancés répondant à des cas d’usage transverses. Dans ce cadre, vous aurez pour objectif de tirer le meilleur parti de l’analyse de données mass ives et variées disponibles chez un opérateur télécom de premier rang. Descriptif du stage :Contexte :Dans le cadre de l’amélioration de l’expérience client, Bouygues Telecom souhaite mettre en place une solution visant à mieux prévenir les clients qui sont à risque de rentrer en parcours de recouvrement et de surfacturation liée à leurs usages. Cette solution se base sur la mise en place d’une posture de communication responsable et bienveillante pour éviter aux clients fragiles de tomber dans une situation financière difficile. La solution initialement développée est un moteur de score de risque d’impayé intégrant un modèle de machine. Le stagiaire aura pour mission d’améliorer l’existant et d’é tendre le périmètre sur les autres produits.
Objectifs du stage :
– Audit de l ‘existant : Pipeline de transformation de données, variables, modèle
– Recherche et intégration de nouvelles variables pertinentes pour le modèle
– Réduction de dimensionalité sur les variables actuelles
– Etendre l’existant sur les autres produits (B&You, Sensation sans mobile et FTTH)
– Étude de l’état de l’art d e la recherche (modèles statistiques et Machine Learning)
– Challenger la modélisation de l’existant- Mise en place de métriques de qualité de données des tables sources et intermédiaires
– Mise en place d’un environnement de simulation pour tester rapidement de nouvelles modélisations sur des échantillons

Détails techniques :Environnement Big Data : Hadoop, Hive, Impala, Spark Environnement dashboarding :
Tableau Librairies python utilisées :
Scikit-learn, Pan das, Numpy, Scipy, xgboost / lightgbm, matplotlib / seaborn / plotly, shap, numba, statsmodelsVolumes de données (ordre de grandeur) :
– 108 lignes sur l’entrainement / historique 1 an- 106 lignes en inférence / jour. Piste de modélisation :
Pénalisation de la fonction de coût, changement dynamique du seuil du modèle Détails du profil :
Etudiant(e) en Grande Ecole d’ingénieur ou d’une Université en Mathématiques Appliquées, Statistique ou Informatique en dernière an née ou césure avec une spécialisation en Data science. Vous avez étudié un ou plusieurs des domaines suivants: Statistique, Machine Learning, Optimisation sous contraintes, Analyse en séries temporelles, etc.
Vous êtes capable de vous adapter rapidement à de nouveaux outils de travail (langages, environnements) et maîtrisez déjà des langages tels que Python, SQL.
Une première expérience avec des outils du Big Data (Hive, Impala, Spark) serait un plus. Vous faites p reuve de rigueur scientifique, autonomie et d’un fort esprit d’équipe. Doté d’u ne bonne expression orale et écrite, vous avez développé une réelle capacité de vulgarisation de sujets techniquement complexes.
Ville : 13 AVENUE DU MARECHAL JUIN 92360 MEUDON

 
 
>>>> CLIQUEZ SUR CE LIEN POUR POSTULER A CETTE OFFRE D EMPLOI : SITE INTERNET



Détails Emploi Informatique & Web