2022-991264 – Ingénieur.e Data F/H

  • Fonction Publique
  • N’importe où
  • Publié il y a 4 semaines

Domaine / Métier : Numérique/Data Scientist
Nature de l’emploi : Emploi ouvert aux titulaires et aux contractuels
Description du poste :
Le Bureau Data et territoire est organisé en 4 pôles : Pôle Projets Territoire, Pôle Data Fabric, Pôle Géomatique, Pôle Data Valorisation
Le Pôle Data Fabric assure l’ensemble des activités suivantes :
– Architecture et administration des plateformes Data (SIG, Big Data, Open Data…),
– Conception et mise en œuvre des traitements d’ingestion et de transformation des diverses sources de données (SI, partenaires, IoT…),
– Réalisation de travaux d’ingénierie de la donnée aux autres pôles du Bureau,
– Gestion du parc de licences de solutions transverses d’exploitation/production de données (SIG, CAO, Self BI…).
Vous prenez en charge les tâches d’intégration et de transformation de données par la réalisation de traitement via ETL (Nifi) et/ou le codage de scripts Python.
Vos réalisations alimentent un socle de traitements ou scripts mutualisés. Elles sont établies avec méthode et rigueur dans un objectif de généricité et réutilisabilité. Vous travaillez en équipe, en lien étroit avec les autres ingénieurs Data, architectes/administrateurs technique.
Vous êtes amené à traiter différents types de données (données métiers alphanumériques, données géographiques, données techniques IoT …), selon différents types de modélisation (Relationnel, NoSQL, fichier à plat…), selon différents formats et différents types de flux (WS normalisé, connexion via API, temps réel, chargement historisé etc…).
Votre expertise Data s’entend sur tout le processus du cycle de vie de la donnée : modélisation, réalisation d’interfaces pour l’intégration, la transformation et la diffusion de ces données, réalisation des outils de vérification de la qualité de la donnée ainsi que les outils d’administration de cette donnée.
Autonome, rigoureux, vous êtes en capacité de réaliser vous-mêmes les traitements nécessaires et aussi de spécifier, piloter et valider d’éventuelles productions réalisées par un prestataire.
Dans un objectif d’établir un socle commun de connaissance afin de garantir une continuité de service au sein du Pôle, vous spécifiez et documentez les traitements mis en place, avec notamment la description des procédures d’exploitation et de rétablissement, participez à la mise en place de contrôle qualité.
Vous serez amené à réaliser des tâches d’administration technique (diagnostic et résolution d’incidents) nécessaire à la continuité d’activité lors d’absence de vos collègues du pôle.
Le traitement des données massives est un axe d’investissement important pour le pôle et le bureau : vous vous impliquez dans le développement des compétences collectives, la montée en charge de cette activité, le support technique aux autres pôles.

Expertise dans la mise en place de pipeline NIFI, dans le développement Python s’appuyant sur des librairies dédiées au traitement de données (Pandas, GeoPandas, NumPy, great_expectations)
Expertise sur les technologies d’exploitation des données :SQL(Trino, PostGres), NoSQL, DataLake(type stockage S3), API(Rest, ElasticSearch), format fichiers(Parquet, Iceberg,Json)
Expertise dans les environnements de développement (JupyterHub, PyCharm, GIT)
Connaissances de méthodes et outils en Data Management, en gestion de
métadonnées
Géolocalisation du poste : 75012 Paris, France
Niveau d’études / Diplôme : Niveau 7 Master/diplômes équivalents
Read More



Détails Emploi Informatique & Web
Generated by Feedzy