2022-956744 – Data engineer – Ingénieur en sciences des données (F/H)

  • Fonction Publique
  • N’importe où
  • Publié il y a 6 mois

Domaine / Métier : Numérique/Data engineer
Nature de l’emploi : Emploi ouvert aux titulaires et aux contractuels
Description du poste :
Au sein de la direction de l’innovation, le (la) data engineer est un(e) expert(e) au plus proche des données. C’est un acteur clé qui participe aux différents projets valorisation des données. Il (elle) sera en charge de définir, développer, mettre en place et de maintenir les outils et les infrastructures nécessaires aux traitements des données.
En outre, il (elle) aura la charge de projets d’analyse et de valorisation des données et pourra proposer des solutions et des axes d’amélioration sur l’existant.
Il (elle) veille à ce que ces solutions soient sécurisées, optimisées et performantes.
Il (elle) aura notamment pour mission de :
· Définir et implémenter les flux de collecte automatique des données issues de l’open data et du SI de l’ANTAI, pour alimenter le datalab ;
· Nettoyer et mettre en qualité les données, normaliser les datasets, homogénéiser les formats et optimiser le stockage des données ;
· Administrer, sécuriser et maintenir en condition opérationnelle la plateforme d’exploitation des données (datalab de l’ANTAI), en lien avec la TME ;
· Assurer pour le pôle statistique, le support technique opérationnel et les formations aux outils du datalab.
· Proposer des modèles statistiques et/ou analytiques pour répondre aux enjeux métier, effectuer des analyses décisionnelles, restituer les résultats sous forme de présentations (rapports, présentations…) ;
· Développer et maintenir les pipelines de données nécessaires à la production des indicateurs de performance (KPI) et des tableaux de bord décisionnels pour les différentes directions de l’ANTAI ;
· S’assurer des performances des traitements des données en fonction des exigences métier (batch ou temps réel), et garantir leur fiabilité leur intégrité ;
· Assister l’Ingénieur expert en Traitement d’images dans les projets de valorisation des données par Intelligence Artificielle (Traitement d’images par Machine Learning) : constitution des bases d’apprentissage, évaluation et validation des performances des modèles développés ;
· Assister le responsable de pôle dans la mise en place d’une gouvernance des données du datalab.
· Assurer une veille technologique régulière dans votre domaine d’expertise ;
· Assurer la documentation technique relative aux développements effectués au pôle data (notebook, diagramme des flux, code) ;
· Assister le responsable du pôle dans l’élaboration de la stratégie d’évolution de l’architecture du datalab.

Le (la) titulaire du poste pourra se voir confier d’autres responsabilités ou missions en fonction de ses compétences, appétences et des besoins du service, telles que le pilotage de projets en lien avec ses domaines de compétences.

Le (la) titulaire a une appétence pour traiter des données complexes et massives sur des thématiques liées à la sécurité routière. Il (elle) mettra ses compétences au service des projets de valorisation des données de l’ANTAI (Analyses statistiques, lutte contre la fraude, Machine Learning, Infocentres décisionnels, API réquisitions).
Le (la) data engineer contribuera également au développement d’une base d’outils modulaire et pérenne, adaptée aux problématiques de traitement des données, afin de démultiplier l’offre de service de la direction de l’innovation.
Enfin, le (la) candidat(e) appuiera le responsable du pôle et prendra part aux enjeux de communication interne et externe de la direction de l’innovation, afin de valoriser l’atout crucial que constitue la science des données pour l’agence.

Connaissances fonctionnelles à acquérir :
· Sensibilisation aux métiers de la sécurité routière, des forces de l’ordre et de la chaîne pénale ;
· Connaissance des marchés publics ;
 Connaissances attendues :
· Langage python et son écosystème
· Forte expertise sur SQL et ses dérivés.
· La modélisation et le traitement de volumes importants de données.
· Méthodes d’exploration de données et d’apprentissage statistique.
· Des compétences en visualisation des données et/ou en cartographie
· Être à l’aise avec les outils d’intégration et de déploiement continue : Jenkins, git, GitHub, gitlab, création de CI/CD, docker, Ansible, kubernetes, etc…
· Outils : Dataiku DSS, Vertica, Tableau, OS Linux
 Connaissances souhaitées :
· Connaissances en R, NoSQL, APIs REST, Elasticsearch
· Connaissances de base en commandes Linux, script shell
· Utilisation de notebooks (Jupyter), concepts généraux du versionning (Git)
·  Librairies classiquement utilisées en datascience (pandas, numpy, scikit-learn, keras …)
· Programmation : bonnes pratiques de développement
· Connaissances en gouvernance des données
 Savoir-faire :
· Capacité d’analyse (compréhension rapide des problématiques et des enjeux)
·  Bonne communication écrite et orale
· Identifier les meilleures sources de données face à une question concrète
·  Interagir avec le métier, communiquer avec des non-experts de la donnée
·  Respecter la législation en matière d’usage de des données
·  Acculturation des équipes à la data (BI et Analytics).

Savoir-être et motivation :
· Intérêt pour la chose publique, sens du collectif et du travail en équipe, appétence pour l’innovation ;
· Vous combinez créativité et autonomie, avec la conviction que la productivité et la rigueur en data science passent par un code de base propre, testé et optimal ;
· Être capable de prioriser et de travailler dans des délais contraints ;
· Savoir organiser son travail en participant à plusieurs projets simultanément.
Niveau d’études / Diplôme : Niveau 7 Master/diplômes équivalents
Read More



Détails Emploi Informatique & Web
Generated by Feedzy