Qu'est-ce que le clustering de basculement ? Comment ça marche + solutions
Publié: 2023-09-22Les entreprises qui ont besoin de transactions en ligne ne peuvent pas se permettre des pannes de serveur. En conséquence, ces entreprises cherchent des moyens de créer une procédure de sécurité qui protège leurs données même en cas de panne du serveur. L’une de ces méthodes est le clustering de basculement.
Le clustering de basculement peut être régi par des solutions de fournisseur de système de noms de domaine (DNS) géré ; cependant, comprendre son mécanisme et ses fonctionnalités clés peut aider à limiter les problèmes de basculement.
Qu’est-ce que le clustering de basculement ?
Le clustering de basculement fonctionne sur un groupe de serveurs informatiques pour assurer la haute disponibilité (HA) ou la disponibilité continue (CA) des applications serveur. Cette technologie garantit qu'en cas de panne d'un serveur ou d'un nœud, un autre nœud de cluster est prêt à prendre en charge la charge de travail sans interruption.
Cette approche maintient les charges de travail de votre serveur évolutives et disponibles. De nombreux programmes serveur majeurs, tels que Microsoft Exchange , Microsoft SQL Server et Hyper-V , s'appuient sur le clustering de basculement pour se protéger.
Certains clusters de basculement emploient des serveurs physiques, tandis que d'autres utilisent des machines virtuelles (VM) . Chacun sélectionne le type de cluster dont il a besoin en fonction des exigences de son application serveur.
Un cluster se compose de deux nœuds ou plus qui échangent des données et des logiciels à traiter via des câbles physiques ou un réseau sécurisé spécialisé. Plusieurs types de technologies de clustering peuvent être utilisées pour l'équilibrage de charge, le stockage et le calcul simultané ou parallèle. Dans certains cas, les clusters de basculement sont combinés à des technologies de clustering supplémentaires.
La fonction principale d'un cluster de basculement est de fournir une autorité de certification ou une haute disponibilité pour les applications et les services. Les clusters CA, également appelés clusters tolérants aux pannes (FT), permettent aux utilisateurs finaux de continuer à utiliser les applications et les services même en cas de panne d'un serveur. Vous constaterez peut-être une brève interruption du service provoquée par les clusters haute disponibilité, mais le système peut récupérer sans perte de données et avec peu de temps d'arrêt.
Pourquoi le clustering de basculement est-il important ?
Avec le clustering de basculement, vous pouvez réparer les nœuds inactifs sans arrêter votre base de données, évitant ainsi les problèmes de temps d'arrêt tout en réparant rapidement les serveurs en panne. De plus, en cas de panne matérielle, cette technique met fin à la base de données pour protéger les nœuds actifs.
Le clustering de basculement automatise également la récupération des données en cas de panne. Cela réduit votre dépendance à l’égard de l’équipe informatique et permet à vos serveurs de récupérer rapidement. Il offre également une excellente disponibilité des clusters en langage de requête structuré (SQL) avec un temps d'arrêt minimal. La fonctionnalité de basculement automatisé du clustering de basculement préserve la fonction de votre base de données, même en cas de panne matérielle.
Comment fonctionnent les clusters de basculement ?
Le clustering de basculement se compose de deux processus fondamentaux, HA et CA, pour les applications serveur.
Alors que les clusters de basculement CA tentent d'atteindre une disponibilité de 100 %, les clusters haute disponibilité s'efforcent d'atteindre 99,999 %, communément appelé cinq neuf. Ce temps d'arrêt ne dépasse pas 5,26 minutes chaque année. Les clusters CA ont une disponibilité plus élevée mais nécessitent plus de matériel pour fonctionner, ce qui augmente leur coût global.
Clusters de basculement haute disponibilité
Un cluster haute disponibilité est un ensemble d'ordinateurs indépendants qui partagent des ressources et des données. Les nœuds d'un cluster de basculement ont accès au stockage partagé. Un lien de surveillance est également inclus dans les clusters haute disponibilité pour vérifier le rythme cardiaque ou l'état de santé des autres serveurs. Un battement de cœur est un réseau privé partagé uniquement par les nœuds du cluster. Ce n'est pas accessible de l'extérieur.
À tout moment, au moins un nœud d'un cluster est actif et au moins un est dormant ou passif.
Dans une configuration de base à deux nœuds, si le nœud 1 échoue, le nœud 2 reconnaît la défaillance via la connexion Heartbeat et se configure comme nœud actif. Le logiciel de clustering sur chaque nœud garantit que les clients se connectent à un nœud actif.
Les installations plus grandes peuvent utiliser des serveurs dédiés pour administrer le cluster. Un serveur de gestion de cluster envoie toujours des signaux de pulsation pour identifier tout nœud défaillant et, le cas échéant, pour demander à un autre nœud de reprendre le travail.
Certains outils logiciels de gestion de cluster gèrent la haute disponibilité pour les machines virtuelles en regroupant les machines et les serveurs dans un cluster. Si un hôte tombe en panne, un autre hôte reprend les machines virtuelles.
En tant que point de défaillance unique possible, le stockage partagé représente un risque. Cependant, la combinaison d'une matrice redondante de disques indépendants 6 et 10 – autrement dit RAID 6 et RAID 10 – peut aider à maintenir le service même en cas de panne de deux disques durs.
L’alimentation électrique peut constituer un autre point de défaillance unique si tous les serveurs sont connectés au même réseau. Fournir à chaque nœud sa propre alimentation sans interruption (UPS) les protège.
Clusters de basculement à disponibilité continue
Contrairement au paradigme HA, un cluster tolérant aux pannes comprend de nombreux ordinateurs qui partagent une seule copie du système d'exploitation (OS) d'un ordinateur. Les commandes logicielles données à un système sont également exécutées sur les autres systèmes.
CA insiste pour que l'organisation utilise du matériel informatique formaté et un UPS de secours. CA a besoin d'une réplique constamment accessible et presque parfaite du système physique ou virtuel exécutant le service. Ce modèle de redondance est connu sous le nom de 2N.
Les systèmes CA peuvent compenser un large éventail de défauts. Un système tolérant aux pannes peut identifier un dysfonctionnement de :
- Un disque dur
- Une unité de traitement dans un ordinateur
- Un sous-système d'entrée et de sortie (E/S)
- Une source d'énergie
- Un élément d'un réseau
Le point de défaillance peut être découvert rapidement et un composant ou une méthode de sauvegarde peut prendre sa place immédiatement sans perturber le service suivant.
Le logiciel de clustering peut connecter deux serveurs ou plus pour se comporter comme un seul serveur virtuel ou construire diverses configurations alternatives de cluster de basculement CA. Par exemple, si l'un des serveurs virtuels tombe en panne, les autres répondent en supprimant temporairement le serveur virtuel du quorum du cluster. Le serveur virtuel redistribue ensuite la charge entre les autres serveurs jusqu'à ce que le serveur en panne soit prêt à redémarrer.
Un serveur matériel double avec tous les composants physiques répliqués constitue une alternative aux clusters de basculement CA. Ils calculent séparément et simultanément sur diverses plates-formes matérielles et se synchronisent à l'aide d'un nœud dédié qui surveille les résultats des deux serveurs physiques. Bien que cette solution offre une protection, elle peut être plus coûteuse.
Fonctionnalités de clustering de basculement
De nombreuses organisations utilisent le clustering de basculement pour les applications critiques. En effet, les caractéristiques suivantes font du clustering de basculement une technique importante.
- Évolutivité : étant donné que le clustering de basculement est basé sur un groupe de clusters collaborant pour éviter les pannes de serveur, vous pouvez facilement et rapidement évoluer selon vos besoins en ajoutant de nouveaux clusters.
- Stabilité : les serveurs en cluster se connectent via des câbles. Les clusters restants peuvent toujours offrir des services même si un ou plusieurs d'entre eux échouent en raison de facteurs externes.
- Surveillance en temps réel : les nœuds du cluster sont constamment surveillés pour garantir leur bon fonctionnement. Lorsqu'un cluster est redémarré ou transféré sur un autre nœud.
- Volume partagé de cluster (CSV) : cette fonctionnalité fournit un espace de noms cohérent et distribué que les nœuds peuvent utiliser lorsqu'ils travaillent avec le stockage partagé. Il est crucial de maintenir les applications serveur en fonctionnement sans interruption du début à la fin.
Types de clusters de basculement
Des avancées significatives en matière de clustering de basculement ont eu lieu au cours de la dernière décennie, de nombreuses organisations proposant désormais leur propre version de solutions de clustering. Certains des services de cluster les plus courants sont détaillés ici.
Clusters de basculement VMware
VMware propose de nombreuses technologies de virtualisation pour les clusters de machines virtuelles. L'architecture CA de vSphere vMotion duplique précisément une machine virtuelle VMware et son réseau entre les réseaux physiques du centre de données.
VMware vSphere HA, un deuxième produit, fournit une haute disponibilité aux machines virtuelles en les regroupant ainsi que leurs hôtes dans un cluster pour un basculement automatisé. De plus, le programme ne s'appuie pas sur des composants externes tels que DNS, ce qui réduit les risques de défaillance possibles.
Cluster de basculement de serveur Windows
La méthode du cluster de basculement de serveur Windows (WSFC) favorise la création de serveurs de basculement Hyper-V. Entre 2016 et 2019, cette stratégie est devenue populaire auprès des utilisateurs de Microsoft Windows. WSFC permet la surveillance du cluster et propose automatiquement le mécanisme de basculement nécessaire. En cas de perte de serveur, WFSC déplace les clusters vers un nœud distinct ou tente de les redémarrer. De plus, sa technologie CSV fournit un espace de noms distribué qui permet à plusieurs nœuds de partager la mémoire.
Serveur SQL
Ce produit Microsoft, introduit avec SQL Server 2017, dispose de solutions HA robustes qui utilisent la technologie WSFC. Les composants du serveur SQL sont considérés comme des ressources de cluster WSFC dans ce contexte. Ils sont davantage intégrés à d’autres ressources dépendantes du WSFC. En conséquence, WSFC a le pouvoir d'identifier et de communiquer les ordres de redémarrage d'une instance de serveur SQL ou de déplacement d'instances comme celles-ci vers un nouveau nœud.
Chapeau rouge Linux
Outre Microsoft, d'autres fournisseurs de systèmes d'exploitation proposent leurs propres solutions de cluster de basculement. Par exemple, les fans de Red Hat Enterprise Linux (RHEL) peuvent utiliser l'extension HA et Red Hat Global File System (GFS/GFS2) pour établir des clusters de basculement HA. Les clusters extensibles à cluster unique couvrant de nombreux emplacements et les clusters multisites tolérants aux catastrophes sont pris en charge. La réplication du stockage de données sur réseau de stockage (SAN) est couramment utilisée dans les clusters multisites.
Applications du clustering de basculement
Ce mécanisme robuste facilite les applications en temps réel suivantes.
Disponibilité des applications critiques.
Les ordinateurs de traitement des transactions en ligne (OLTP) doivent disposer de systèmes résistants aux pannes. OLTP, qui nécessite une disponibilité complète, est utilisé pour les systèmes de réservation des compagnies aériennes, les transactions boursières électroniques et les services bancaires ATM.
De nombreux secteurs, tels que la fabrication, le transport maritime et la vente au détail, utilisent des clusters CA ou des ordinateurs résistants aux pannes pour des applications importantes pour leur mission. Le commerce électronique, la gestion des commandes et les systèmes de pointage du personnel sont des exemples.
Les clusters à haute disponibilité sont souvent acceptables pour regrouper des applications et des services qui ne nécessitent qu'une disponibilité de cinq à neuf.
Secours aux sinistrés
La reprise après sinistre bénéficie également du clustering de basculement. Il est fortement recommandé d'héberger les serveurs de basculement sur des sites distants, car une catastrophe telle qu'un incendie ou une inondation détruit tout le matériel physique et les logiciels.
Storage Replica, une technologie qui duplique les volumes entre les serveurs pour la reprise après sinistre , est incluse dans Windows Server 2016 et 2019. Le basculement extensible est une fonctionnalité technologique qui permet aux clusters de basculement de s'étendre sur deux emplacements.
Les organisations peuvent répliquer les données sur différents centres en étendant les clusters de basculement. Si une tragédie survient à un endroit, toutes les données sont conservées sur des serveurs de basculement aux autres endroits.
Réplication d'une base de données
Selon Microsoft, le WSFC a été lancé pour la première fois dans Windows Server 2016 pour protéger les services « critiques », comme sa base de données SQL Server et son serveur de communications Microsoft Exchange.
Pour la réplication de bases de données , d'autres fournisseurs proposent une technologie de cluster de basculement. Par exemple, MySQL Cluster dispose d'une méthode de battement de cœur qui permet une détection rapide des pannes sur les autres nœuds du cluster, souvent en moins d'une seconde, sans interruption de service pour les clients.
Les bases de données peuvent être répliquées vers des sites éloignés en utilisant la capacité de réplication géographique.
Avantages des clusters de basculement
L'idée des clusters de basculement est de garantir que les utilisateurs subissent un minimum d'interruptions de service. Cependant, d'autres avantages supplémentaires du clustering de basculement sont abordés ci-dessous.
- Disponibilité accrue des ressources : si un serveur intelligent tombe en panne, les autres serveurs du cluster en prennent la charge. Cela permet d’économiser du temps et des informations cruciales.
- Allocation stratégique des ressources : vous pouvez répartir les projets entre les nœuds de la manière que vous choisissez. Cela minimise les frais généraux puisque tous les ordinateurs ne sont pas nécessaires pour exécuter tous les projets simultanément, ce qui vous permet d'utiliser vos ressources plus librement.
- Puissance de traitement accrue : plus de machines, plus de puissance.
- Une plus grande évolutivité : à mesure que votre base d'utilisateurs et la complexité de vos rapports augmentent, vos ressources augmentent également.
- Gestion simplifiée : le clustering facilite la gestion des systèmes importants ou à évolution rapide.
Limites du clustering de basculement
Aussi important que soit le clustering de basculement, il se heurte aux limitations suivantes.
- Configurations complexes : la configuration du clustering de basculement pour Windows nécessite que vous gériez plusieurs réseaux et cartes réseau à la fois. De ce fait, déployer cette méthode est difficile, surtout pour les débutants.
- Intégrations d'outils : le clustering de basculement Windows et Hyper-V doivent être plus étroitement intégrés. Vous devez ajuster chacun d'eux pour terminer le clustering de basculement avec succès.
- Interface Web : il n'existe pas d'interface Web pour ajuster les paramètres du cluster. Pour accéder à la fonctionnalité du gestionnaire de cluster, vous devez vous connecter manuellement à un poste de travail distant.
Solutions de clustering de basculement : fournisseurs de DNS gérés
En travaillant conjointement avec des systèmes de clustering de basculement, les fournisseurs de DNS gérés redirigent le trafic vers d'autres serveurs ou centres de données lors des événements de basculement, garantissant ainsi un accès ininterrompu à vos services afin d'obtenir une haute disponibilité et de minimiser les temps d'arrêt.
Cinq principaux fournisseurs de DNS gérés :
- DNS Cloudflare
- DNS Azure
- Infoblox NIOS
- DÉVELOPPEUR WPMU
- Gestionnaire DNS
* Ci-dessus se trouvent les cinq principaux logiciels de fournisseurs de DNS gérés du rapport Grid de l'automne 2023 de G2.
Moderniser la fiabilité
Le clustering avec basculement est devenu une option fiable et essentielle pour la haute disponibilité et la tolérance aux pannes au sein des infrastructures informatiques actuelles. Il assure la continuité des opérations malgré les pannes matérielles ou la maintenance planifiée en répartissant automatiquement les charges de travail et les ressources sur de nombreux nœuds en réseau. Cette technologie vous offre une autre façon de gérer l'aspect le plus important de votre entreprise : rendre l'expérience de chaque client sûre et heureuse.
Renforcer la résilience de votre système ne fait pas de mal non plus !
Commencez avec un guide sur la sécurité DNS pour une stratégie système robuste.