2022-834115 – Data Engineer – Plateforme Big Data de l’AP-HP 2022-069

  • Fonction Publique
  • N’importe où
  • Publié il y a 3 mois

Domaine fonctionnel : Numérique/Data engineer
Nature de l’emploi : Emploi ouvert aux titulaires et aux contractuels
Description du poste :
Mission générale :
Au sein de l’équipe en charge de la Plateforme Big Data de l’APHP, vous aurez pour missions de proposer et de développer des outils ou composants répondant aux attentes des médecins et chercheurs pour l’exploitation des données collectées dans le cadre de leurs projets de recherche. Ces développements s’inscrivent, d’une part, dans un contexte de standardisation des données selon le modèle de données commun OMOP et d’interopérabilité sur la base du standard d’échange HL7-FHIR et, d’autre part, dans une démarche de développement et d’intégration continue (DevOps/DataOps).
Il s’agira de contribuer à la création d’outils d’intégration, de visualisation, d’exploration et d’enrichissement de données médicales pour la recherche, souvent en lien direct avec des personnels médicaux. Outre l’intégration technique des données cliniques, les développements relèvent globalement de la pseudonymisation des données pour assurer la confidentialité des dossiers médicaux, de la standardisation des modèles de données, de la mise en place de moteurs de recherche performant incluant des notions sémantiques et de l’analyse qualitative et statistique des données collectées. Selon la typologie des données (données structurés, imagerie, voix, signaux physiologiques, etc.) des outils plus spécifiques sont également mise en œuvre.
Vous intervenez dans le cadre de groupes de travail pluridisciplinaires visant la définition de nouvelles fonctionnalités et vous réaliserez le test et la validation des nouvelles fonctionnalités implémentées avant leur mise en production. Par ailleurs, vous participez à l’assistance à la mise en œuvre et à la maintenance en condition opérationnelle des outils développés.
Chaque année des objectifs précis seront établis en lien avec la/le responsable hiérarchique.
Missions principales :
 Réaliser une analyse des besoins exprimés par les médecins et chercheurs de l’AP-HP dans le cadre de projets de recherche ;
 Rédiger des cahiers des charges, spécifications fonctionnelles et techniques ainsi que des dossiers d’architecture technique ;
 Concevoir et développer des outils (sélection de cohortes de patients, modélisation, algorithmes d’analyse, méthodes statistiques, visualisation, etc.) adaptés au contexte du cluster big data ;
 Contribuer à la standardisation de la modélisation des données au format OMOP ;
 Développer des web-services (FHIR, etc.) ;
 Contribuer à la mise en place de pipelines de traitement et d’analyse de données en temps réel (Kafka, etc.) ;
 Optimisation de la performance des outils dans un contexte big data (Hadoop / Spark) ;
 Rédiger la documentation technique ainsi que la documentation utilisateur ;
 Dans le cadre des développements réalisés en Open Source, participer à l’animation de la communauté autour des projets créés par la résolution de bugs, la gestion des suggestions de modification du code (Pull/Request) ou encore la gestion des propositions d’améliorations ;

Savoir-faire requis
Requis :
• Expertise en Programmation Informatique (Windows & UNIX)
• Expertise des langages Java et/ou Scala
• Bonne maitrise des langages Python/R et de bash
• Maitrise des architectures et de l’écosystème Big Data (Hadoop, Hive, HBase, Spark, Kafka, …)
• Bonnes connaissance des bases de données Oracle, Postgresql ou MySQL et langages associés (sql)
• Bonnes connaissances des technologies Back-End et des API Rest/GraphQL
• Connaissance approfondie en méthodes de développement logiciel (dont cycle en V, méthodes agile), méthodes d’analyse et de modélisation (Merise, UML …)
• Connaissance des méthodologies devops et des outils associés (Docker, Kubernetes, Jenkins…)
• Connaissances en méthode de conduite de projet (planification, reporting, analyse de risques, …)
Apprécié :
• Connaisance du modèle de donnée OMOP et du standard d’interopérabilité HL7-FHIR
• Connaissance du moteur de recherche Apache Lucene et de sa mise en oeuvre
• Connaissances en administration d’environnements Linux
• Connaissance en statistiques
• Connaissances des problématiques fonctionnelles hospitalières (structures, processus) et des métiers de la santé
• Connaissances en droit des données informatiques
• Connaissance des bonnes pratiques de sécurité informatique ;
• Connaissance de la réglementation informatique et libertés ;
Travail en équipe :
• Concevoir et évaluer un projet / un processus relevant de son domaine de compétence ;
• Identifier, analyser, prioriser et synthétiser les informations relevant de son domaine d’activité ;
• Animer / communiquer / motiver au sein d’une équipe projet ;
• Capacité à animer des réunions courtes, en imposant une préparation et un compte rendu ;
• Rédiger et mettre en forme des notes, documents et /ou rapports, relatifs à son domaine de compétence ;
• Concevoir et rédiger une documentation spécifique à son domaine de compétence ;
• S’exprimer en public ;
Qualités requises :
• Recueillir, analyser, formaliser et valider les besoins des utilisateurs ;
• Concevoir des modèles de données, appréhender les formats de données et les procédures d’échange ;
• Autonomie, rigueur, méthode ;
• Curiosité et capacité d’adaptation et d’anticipation
• Esprit d’analyse et de synthèse, bonne aptitude rédactionnelle
• Excellentes aptitudes relationnelles et à la communication, capacité d’écoute et de vulgarisation, capacité de formation
• Esprit d’équipe et fort sens du relationnel
• Adhésion aux valeurs du service public et intérêt prononcé pour le domaine de la santé
Connaissances associées
Apprécié :
• Environnement des systèmes d’information hospitaliers
• Enjeux liés à la recherche, à l’analyse de données et aux technologies de machine learning/deep learning, notamment dans le domaine de la santé (santé publique, génétique, épidémiologie…)
PRE-REQUIS
• Ingénieur(e) ou équivalent en informatique
• Expérience en développement informatique
Niveau d’études : Niveau 7 Master/diplômes équivalents
Read More



Détails Emploi Informatique & Web