L'équipe Server Operations assure la disponibilité et la performance de l'infrastructure physique qui soutient l'ensemble des services Google.
Dans ce rôle, vous êtes responsable de l'intégrité technique de nos parcs de serveurs. Tandis que nos partenaires externes (vendors) prennent en charge les tâches de manutention à fort volume, telles que la mise en rack (racking), le câblage physique et le remplacement de masse de composants, votre mission se concentre sur les opérations de déploiement logique et la résolution d'incidents techniques.
Le quotidien est rythmé par des flux de travail structurés : vous intervenez pour diagnostiquer des pannes serveurs, valider des configurations réseau et garantir que chaque équipement est parfaitement opérationnel au sein de nos clusters Linux.
Responsabilité et missions
* Déploiement technique : Installer, configurer et tester les nouveaux équipements (serveurs, composants de stockage). Vous validez la conformité des installations physiques réalisées par les prestataires avant leur mise en production.
* Diagnostics et Remédiation : Identifier et résoudre les pannes matérielles et logicielles. Vous intervenez sur des problématiques de connectivité réseau, de défaillance de composants internes ou d'erreurs système en suivant des protocoles précis.
* Infrastructure Réseau : Configurer et vérifier le bon fonctionnement des éléments de connectivité (commutateurs, routeurs, fibres optiques) pour assurer la stabilité du trafic de données.
* Maintenance préventive : Effectuer des contrôles réguliers et des mises à jour sur l'infrastructure pour prévenir les interruptions de service.
* Suivi de projet : Collaborer au sein de petites équipes pour coordonner des phases de déploiement d'envergure, en veillant au respect des délais et des standards de qualité Google.
Métier
Gestionnaire d'exploitation informatique
Compétences professionnelles
1. Installer et intégrer le matériel (station, équipement réseau, périphériques, ...) dans l'environnement de production et configurer les ressources logiques et physiques
2. Déclencher ou planifier les interventions de maintenance et contrôler la conformité des interventions
3. Surveiller le fonctionnement de ressources d'exploitation spécifiques : Serveurs
4. Surveiller le fonctionnement de ressources d'exploitation spécifiques : Systèmes
5. Surveiller le fonctionnement de ressources d'exploitation spécifiques : Réseaux informatiques