Domaine / Métier : Numérique/Administratrice / Administratrice de bases de données
Nature de l’emploi : Emploi ouvert aux titulaires et aux contractuels
Description du poste :
1. Caractéristiques du service (missions, périmètre d’action, effectifs, organisation…) :
Pour réaliser cette mission, l’équipe pôle des données est résolument mixte, constituée d’experts métiers, de juristes, de rédacteurs MOA, de data analysts, de data engineers et de data scientists.
Au sein de la Délégation à la Transformation Numérique, le pôle des données collabore activement avec les pôles « culture numérique » et « UX/UI » afin d’accompagner les innovations digitales de la DGFiP.
2. Principaux enjeux :
La DGFiP a mis en œuvre une infrastructure de « Lac de données » basée sur la distribution open-source Hortonworks permettant de :
– favoriser et centraliser l’accès aux données à des fins de valorisation ;
– faciliter les traitements de croisements de données ;
– promouvoir les usages de la datascience.
3. Eléments de contexte spécifiques :
Dans un objectif de stratégie data driven, vous participerez aux projets de valorisation des données en industrialisant le traitement de volumétries de données conséquentes (plusieurs dizaines voire centaines de To dans certains cas).
Savoir-être :
– vous avez de grandes capacités d’organisation. Vous êtes habitué à animer plusieurs travaux en équipe en parallèle avec ou sans adhérence majeure ;
– vous avez des très bonnes qualités en communication. Vous serez amené à dialoguer avec de nombreuses directions ;
– vous êtes autonome, transparent et savez remonter de manière synthétique les activités de votre équipe vers les personnes concernées par ces informations ;
– vous êtes force de proposition et entreprenez les actions pour concrétiser des projets.
Le service au citoyen et l’ambition de transformer l’action publique sont des sources de motivation
Savoir-faire :
– manager une équipe de data engineer pour développer de nouveaux pipelines de données ;
– valider les choix technologiques d’architecture ;
– construire l’écosystème technique et l’offre de service d’une Data Plateforme ;
– travailler en collaboration avec les data scientists pour leur fournir un support à l’industrialisation de leurs travaux ;
– déployer des infrastructures dans le Cloud interministériel Nubo ;
– mettre en œuvre le déploiement à l’échelle de la visualisation de données ;
– mettre en œuvre un catalogue des métadonnées de la DGFiP.
Compétences requises :
– expérimenté sur les outils et langage de traitements de donnée : Python, Spark, SQL et Big Data (écosystème hadoop) ;
– vous êtes à l’aise sur les technologies d’architecture moderne de données : kubernetes, terraform, ansible, docker, airflow, trino, dbt ;
– vous connaissez les principes de modélisation décisionnelle, d’organisation et d’utilisation d’un lac de données, ainsi que la préparation et mise en qualité de données ;
– vous êtes également expert dans les domaines de la data visualisation (Tableau Software), datascience et machine learning ;
– vous êtes familier à la méthodologie Agile, Scrum et Kanban ;
– vous avez une expérience de management d’une équipe technique et de cadres intermédiaires (middle managers).
Niveau d’études / Diplôme : Niveau 7 Master/diplômes équivalents
Voir le site