Domaine fonctionnel : Numérique/Responsable d’exploitation
Nature de l’emploi : Emploi ouvert uniquement aux contractuels
Description du poste :
En amont :
· Vous participez à la veille technologique et élaborez des préconisations ;
· Vous contribuez à la définition de la feuille de route technologique ;
· Vous définissez et participez à l’acquisition de nos futures infrastructures.
Lors de l’installation d’une infrastructure :
· Vous contribuez à la conception et l’installation du système des infrastructures ;
· Vous développez des outils d’exploitation (surveillance, supervision, etc).
En exploitation :
· Vous menez des activités d’audit, d’analyse et de tuning des infrastructures ;
· Vous optimisez le fonctionnement et l’usage des ressources de calcul ;
· Vous proposez et implémentez des optimisations de performance dans les différentes couches logicielles (systèmes, bibliothèques de communications, etc) ;
· Vous réalisez et pilotez les activités concourant à la disponibilité et à la tenue d’un bon niveau de service ;
· Vous préparez et participez aux opérations de maintenance planifiées ;
· Vous contribuez à la rédaction et à la mise à jour du référentiel documentaire en y intégrant les évolutions apportées.
Vos activités seront les suivantes :
· Administration et maintien en conditions opérationnelles de l’infrastructure HPC incluant les nœuds de calcul CPU et GPU et les systèmes de stockages associés, et optimisation des configurations ;
· Développement de scripts et de procédures d’automatisation en mode devops à des fins de maintenance et validation (Linux, Shell script, Ceph), et mise en place de solutions de surveillance des systèmes ;
· Préparation et exécution des opérations de maintenance logicielle ;
· Rédaction de documentations techniques et des procédures d’exploitation (Wiki) ;
· Intégrer complétement la démarche DevOps CI/CD sur les différents projets, en contribuant au scripting de leur tool-chain CI/CD ;
· De bonnes connaissances en administration de cluster CEPH sont fortement souhaitables.
De formation supérieure bac + 5, vous possédez une expérience en administration de système Linux/UNIX, idéalement dans un environnement HPC / calcul scientifique.
Vous maitrisez tout ou partie des environnements/technologies suivants avec une expérience significative:
· Administration de systèmes GNU/Linux HPC (CentOS ou Debian),
· Réseaux : Infiniband, Ethernet, FC,
· Scripting : shell, python,
· Monitoring : zabbix, Grafana,
· Les technologies conteneurs (Docker, Kubernetes) et orchestrateurs (Ansible),
· Vous savez configurer/modifier les principaux services d’un système Linux ,
Process d’intégration continue, Jenkins, Gitlab,
Des connaissances de base réseaux et sécurité, CEPH sont appréciées,
Vous faites preuve des qualités humaines suivantes :
– Rigueur, esprit d’équipe et d’analyse, organisation, indépendance, proactif.
Niveau d’études : Niveau 7 Master/diplômes équivalents
Read More