2022-803151 – Responsable Data Platform H/F

  • Fonction Publique
  • N’importe où
  • Publié il y a 4 mois

Domaine fonctionnel : Numérique/Product Owner
Nature de l’emploi : Emploi ouvert aux titulaires et aux contractuels
Description du poste :
La DGFiP a mis en œuvre une infrastructure de « Lac de données », open-source, basée sur la distribution Hortonworks. Elle en a défini l’architecture technique et logicielle, et réalisé l’intégralité de sa mise en œuvre. L’offre du lac de données permet de :
– Faciliter et centraliser l’accès aux données pour optimiser leur valorisation ;
– Développer les mécanismes de croisements de données ;
– Valoriser les données au travers du service de Dataviz ;
– Promouvoir en facilitant les usages de la datascience.

L’infrastructure on-premise de la DTNum comprend :
– Une infrastructure classique ;
– Un cloud interministériel nommé Nubo reposant sur Openstack.

La valorisation des travaux de datascience et de data engineering sera portée par un enrichissement et évolution d’une plateforme permettant de répondre aux besoins futurs suivants :
– Data Visualisation sous Tableau Software (montée à l’échelle à développer) ;
– Data Transformation : transport, préparation et partage de données sur des volumétries massives ;
– Data Science : proposer un environnement comprenant une chaîne de MLOps (notebook serverless, CI/CD, feature engineering, feature store, hyper parameter tuning, model versionning, model serving) ;
– Data Gouvernance : mise en œuvre de services autour de la sécurité et gouvernance des données (dictionnaire de données, anonymisation, etc).

Missions – Activités au sein d’une équipe de Data Engineering :

Lead d’une équipe technique :
– Encadrement technique d’une équipe dédiée ;
– Suivi et recrutement de l’équipe ;
– Animation et montée en compétence de l’équipe (code review, best practices, retex, recommandations de formation, certifications, veille technologique) ;
Pilotage des activités autour de la plateforme :
– Conseils et assistance des métiers, MOA et MOE dans les phases projets d’utilisation de la plateforme ;
– Cadrage des projets ;
– Pilotage des releases auprès des équipes de delivery ;
– Communication sur l’offre de service ;
– Assurer la documentation interne et externe de la plateforme ;
– Reporting de l’activité et des évolutions de la plateforme ;
– Animer une communauté autour de la plateforme data ;
Assurer l’évolution technologique du lac de données :
– Veille technologique en relation avec les communautés data ;
– Accompagnement des projets de visualisation de données et de data science ;
– Développer et enrichir l’offre de service du lac de données via la définition de composants fonctionnels ;
– Définir une roadmap fonctionnelle et technologique ;
– Assurer le maintien et reporting d’un backlog.

– Expérimenté sur les technologies Nosql et Big Data ;
– Vous êtes compétent sur les technologies Python, Scala, Spark, Hortonworks, Tensorflow, TFX, Kubeflow, Apache Beam ;
– Vous maîtrisez également les technologies Devops telles que Terraform, Ansible, Kubernetes, Docker, Openstack, et les technologies API ;
– Vous avez déjà participé à l’industrialisation complète d’une chaîne de Machine Learning (MLOps) ;
– L’ambition de développer une plateforme dans son intégralité est un projet motivant.

Vous avez de grandes capacités d’organisation, de communication et de rédaction et vous êtes habitués à animer divers travaux en équipe en parallèle avec ou sans adhérence majeure.
Vous avez des très bonnes qualités humaines, en faisant partie d’une équipe transversale, vous serez amené à dialoguer en permanence avec les différents bureaux du SSI.
Vous êtes autonome, transparent et savez remonter de manière synthétique les activités de votre équipe vers les personnes concernées par ces informations.
Niveau d’études : Niveau 7 Master/diplômes équivalents
Read More



Détails Emploi Informatique & Web