La technologie du clustering

Qu'est-ce que le clustering ?

Le mot clustering, grappe de serveurs ou ferme de calcul en français, signifie en informatique surtout le regroupement de serveurs pour augmenter la disponibilité des services, à permettre une répartition de la charge, à faciliter la monté en charge et ainsi à faciliter la gestion de ressources. Le clustering n'est donc rien d'autre que la connexion en parallèle de plusieurs serveurs qui, ensuite, agissent comme un seul serveur plus puissant et plus performant.
 
Les serveurs en clustering partagent les ressources, surtout les CPUs et le mémoire vive, et augmentent donc vitesse et disponibilité mais ils ne partagent généralement pas les mêmes disques durs. Il est donc important à ne pas seulement utiliser le clustering mais, en même temps, à disposer de la technologie RAID pour les disques durs.

Les avantages du clustering

Le clustering n'augmente pas seulement la vitesse du serveur mais augmente aussi sensiblement le temps qu'un serveur est disponible. Dès qu'un serveur tombe en panne ou q'il soit surchargé, un autre serveur prendra le relais et le risque à perdre de clients ou de visiteurs est donc presque zéro.
 
Cela joue surtout un rôle pour les sites dynamiques qui se basent sur le fonctionnement des bases de données. La panne d'un serveur de base de données empêche parfois pendant des heures l'enregistrement de commandes ou même la livraison de fichiers. La seule solution est donc à utiliser les serveurs de bases de données en clustering pour éviter de tels problèmes.

Le clustering et le référencement

Un serveur qui ne fonctionne pas, envoie un message d'erreurs ou l'erreur 404 aux robots, ce qui peut détruire le positionnement dans un moteur de recherche. Surtout les sites en ASP, PHP ou JSP qui ne se basent pas sur la technologie du clustering peuvent avoir de problèmes auprès de moteurs de recherche comme Google si la base de données est down pendant de nombreuses heures.
 
Il est donc important pour un Webmaster à choisir un hébergeur qui utilise le clustering pour garantir un fonctionnement permanent du site.

Les modèles de base du clustering

On fait la différence entre trois models de base du clustering dont le choix dépend de divers facteurs et nécessite une analyse profonde de la part du Webmaster.
 
Le Shared Everything Model se base sur le fait qu'au moins deux ordinateurs partagent leurs ressources entièrement et que chaque disque dur des ordinateurs soit également partagé. Les ordinateurs travaillent donc en parallèle et partagent chaque ressource matérielle.
 
Le Shared Nothing Model utilise au moins deux ordinateurs en parallèle mais ne partage pas les disques durs. Les ordinateurs qui font partie du clustering ne peuvent donc pas lire les informations des autres ordinateurs du système ni écrire sur leurs disques durs.
 
Les mirrored Servers se basent sur la technologie du clustering où le serveur dominant du système travaille en permanence et le deuxième serveur intervient dès que le premier n'a plus la capacité à livrer la quantité de documents nécessaires où s'il tombe en panne.

Les serveurs du clustering

Le clustering ne se pratique pas seulement avec les serveurs Web mais aussi, selon besoin, avec les serveurs de base de données, de serveurs mail ou toute autre serveur impliqué dans le trafic de l'Internet.
 
Le clustering fonctionne avec tous les systèmes opératives et peut s'utiliser même en réseau local ou dans l'Intranet d'une entreprise.
 
Les liens suivants ouvrent de pages supplémentaires qui traitent la technologie du clustering :
Guide du Clustering pour les SGBD
Grappe de serveurs ou ferme de calcul
Clustering Flash Communication Server for Live Webcasts
Web Server Clustering
Scalable Web Server Clustering Technologies