2022-803138 – Responsable Big Data H/F

  • Fonction Publique
  • N’importe où
  • Publié il y a 4 mois

Domaine fonctionnel : Numérique/Data engineer
Nature de l’emploi : Emploi ouvert aux titulaires et aux contractuels
Description du poste :
La DGFiP a mis en œuvre une infrastructure de « Lac de données », open-source, basée sur la distribution Hortonworks. Elle en a défini l’architecture technique et logicielle, et réalisé l’intégralité de sa mise en œuvre.
Cette offre d’infrastructure permet de :
– Faciliter et centraliser l’accès aux données pour optimiser leur valorisation ;
– Favoriser la réutilisation et le partage des données entre services de la DGFiP (données internes, données des partenaires) et accélérer notamment l’Open Data ;
– Développer les mécanismes de croisements de données (décloisonner les infocentres spécialisés) ;
– Valoriser les données issues des applications de gestion ou provenant des partenaires de la DGFiP ;
– Promouvoir en facilitant les usages de la datascience.
La valorisation des travaux de datascience et de data engineering sera portée par une équipe d’experts en visualisation de données en contact direct avec les bureaux métier.
Missions – Activités au sein d’une équipe de Data Engineering :
Lead de l’équipe technique :
– Encadrement technique des data engineers ;
– Suivi et recrutement des data engineers (internes et prestataires) ;
– Animation et montée en compétence de l’équipe (code review, best practices, retex, recommandations de formation, certifications, veille technologique) ;
– Définition d’une architecture de données (logique et technique) ;
– Définition de template de projets Data.

Pilotage des activités autour du lac de données :
– Pilotage des projets d’alimentation du lac de données (20+ applications à venir) ;
– Conseils et assistance des métiers, MOA et MOE dans les phases projets d’alimentation du lac de données ;
– Cadrage des projets d’alimentation du lac de données ;
– Pilotage des releases auprès des équipes de delivery ;
– Communication sur l’offre de service du lac de données ;
– Assurer la documentation interne et externe du lac de données ;
– Reporting de l’activité et des projets sur le lac de données ;
– Animer une communauté autour du Big Data.

Assurer l’évolution technologique du lac de données :
– Veille technologique en relation avec les communautés data ;
– Accompagnement des projets de visualisation de données et de data science ;
– En collaboration avec l’équipe data gouvernance, assurer une gouvernance des données dans le lac de données ;
– Développer et enrichir l’offre de service du lac de données via la définition de composants fonctionnels.

– Expérimenté sur les technologies Nosql ou Big Data ;
– Vous êtes compétent sur les technologies Python, R Shiny, Scala, Spark, Hortonworks. Idéalement, vous connaissez également Kubernetes, Docker, Openstack, et les technologies API ;
– Vous connaissez les principes de modélisation décisionnelle, d’organisation et d’utilisation d’un lac de données, ainsi que la préparation et mise en qualité de données. Vous êtes également acculturé à la datascience et machine learning ;
– Vous avez de grandes capacités d’organisation, de communication et de rédaction et vous êtes habitués à animer divers travaux en équipe en parallèle avec ou sans adhérence majeure ;
– Vous avez des très bonnes qualités humaines, en faisant partie d’une équipe transversale, vous serez amené à dialoguer en permanence avec les différents bureaux du SSI ;
– Vous êtes autonome, transparent et savez remonter de manière synthétique les activités de votre équipe vers les personnes concernées par ces informations.
Niveau d’études : Niveau 7 Master/diplômes équivalents
Read More



Détails Emploi Informatique & Web