You are on page 1of 6

Description

Ensemble logique de serveurs qui garantissent une haute disponibilit des


ressources et une rpartition des charges de traitement.
Prsentation
Pourquoi le clustering ?
La technologie de clustering permet d'avoir une haute disponibilit des ressources
publies. On utilise cette technologie pour avoir une disponibilit et stabilit des
ressources proche de 100 %. Tolrance zro pour les pannes matrielles ou logicielles. Il
y a galement une rpartition des charges entre les nuds d'un cluster.
Quelques explications...
Le clustering est une technique permettant de mettre en parallle plusieurs
systmes d'exploitation. Un ensemble de machines en rseau destin un
fonctionnement en parallle (grant des ressources stockes sur des disques partags)
constitue un cluster.
Dans ce cluster, chaque machine sera un Nud ("node" en anglais). Tous les
nuds sont des stations de travail dans le sens o elles possdent un ou plusieurs
processeurs en opposition aux terminaux.
Le rseau ainsi form est un NOW (Network Of Workstation - rseau de stations
de travail).
Cette mthode permet de diviser les temps d'excution d'un programme entre
plusieurs machines rparties sur un rseau. Le principe utilis dans le clustering consiste
diminuer le temps d'excution d'une tche en la fractionnant sur plusieurs machines.
Une tche rpartie sur N machines arrivera N fois plus vite terme que sur une seule.
Les diffrentes techniques de clustering
Shared Everything Model :
Permet aux 2 noeuds de faire des entres/sorties et lecture/criture sur
tous lesdisques partags. Il y a un partage des ressources matrielles.
Shared Nothing Model :
Chaque nud gre son propre disque et est le seul habilit crire et lire
sur les ressources du disque qui lui est attribu. Chaque nud se voit attribuer
ses propresressources matrielles grer.
Mirrored Servers :
Un seul nud rpond aux requtes clientes, lautre nud est en attente
prt remplacer son homologue en cas de dfaillance. Il sagit d'une copie
conforme du premier nud.
Clusters Microsoft
Depuis la version NT4 de son systme d'exploitation Windows, Microsoft propose
de mettre en place un cluster constitu de serveurs Microsoft pour rpondre aux besoins
croissants des entreprises en terme de messagerie lectronique, de base de donnes et
depuis quelques annes de serveurs WEB ou FTP.
La firme de Redmond propose deux types de clustering :

Le clustering de Service
Il s'agit de raliser des clusters d'application et de rendu de service. En fait
Microsoft propose un cluster de Haute Disponibilit, tolrance aux fautes. Il permet
de fournir une garantie et une qualit de service aux utilisateurs d'applications comme
Microsft SQL Server.

Le clustering rpartition de charge


Ici, Microsoft garantit une rpartition de charge rseau sur des flux IP travers un
cluster constitu de 32 nodes au maximum. Typiquement, il s'agit de rpartir les charges
rseaux d'un serveur WEB, d'un serveur de mdia,...
A travers ses solutions, Microsoft vise les entreprises dsireuses d'amliorer leur
production, en proposant des systmes permettant d'amliorer et d'acclrer le travail
quotidien des employs, mais aussi permettant de raliser du commerce (comme le ebusiness) avec un plus grand nombre de clients.
Toutefois, il existe encore quelques freins dans l'utilisation de tels systmes. En
effet, les clusters Microsoft ne fonctionnent que sur de l'architecture Microsoft. De plus,
les systmes dexploitation proposs subissent trop souvent des correctifs pour en faire
des systmes fiables et stables.
Clusters Linux
L'alternative, tous ces clusters chers, est Linux. Il suffit de possder quelques
PC, une distribution Linux et quelques logiciels permettant de raliser le parallle entre
les nodes du systme. Toutefois, il faut savoir que de nombreuses personnes ont dj
effectu des recherche et mises en uvre des clusters en dveloppant des applications
Open Source et donc disponible sur le rseau en version gratuite.
En fait, le caractre quasi gratuit de ce type de clustering rside dans le fait que le
systme n'est pas livr cl en main et ncessite donc un investissement humain
important pour le mettre en place. De plus, la mise en uvre de ce type de solution n'est
pas aise et demande de bonnes comptences en informatique et rseaux, et de bonnes
connaissances du monde Linux, mais surtout un travail de patience et de passionn.
Enfin, dans un dernier temps, il faut trouver le meilleur support et le meilleur
emplacement qui mettront en valeur le systme ralis. Pour l'administrateur, il s'agira
de trouver le meilleur matriel et de placer son systme l o il est le plus attendu.
Points Points forts
- Optimisation des performances
- Haute disponibilit
- Scurit
- Redondance
- Rapidit
Points faibles
- Cot important
- Ncessite de solides connaissances informatiques
- Technique gourmande en bande passante et en temps.
Evaluation
Le clustering est en fait une solution d'alternative pour les personnes et/ou les
entreprises n'ayant pas les moyens de possder un super-calculateur. En effet, le cot
d'une architecture en clusters reste tout de mme trs infrieur celui des supersordinateurs.

De plus, dans un cluster, l'administrateur peut tendre la puissance de son


systme sans trop de difficults dans la mesure o cette mise jour ne consiste qu'
rajouterun node dans l'architecture et le dclarer auprs des autres acteurs du cluster
(surtout le node server, le "chef d'orchestre" du cluster).
Nanmoins, les systmes en clustering les plus puissants et les plus performants
restent des solutions bases sur du matriel et des Unix propritaires, et apparaissent
tout de mme comme des solutions trs chres et donc rserves au grandes structures.
Pour palier ce problme, il existe tout de mme d'autres alternatives pour monter un
cluster.

Qu'est-ce que RAID?


RAID (Redundant Array of Independent Disks, l'origine Redundant Array of
Inexpensive Disks ) est une manire de stocker les mmes donnes diffrents endroits
(donc, de manire redondante) sur de multiples disques durs s. En plaant des donnes
sur plusieurs disques, I / O (entre / sortie) les oprations peuvent se chevaucher de
faon quilibre, l'amlioration des performances. Depuis plusieurs disques augmente le
temps moyen entre pannes ( MTBF ), de stocker des donnes de manire redondante
augmente galement la tolrance aux pannes .
Un RAID apparat dans le systme d'exploitation un seul disque dur
logique. RAID utilise la technique de la entrelacement , ce qui implique le
partitionnement d'espace de stockage de chaque disque en parts allant d'un secteur (512
octets) jusqu' plusieurs mgaoctets.Les rayures de tous les disques sont entrelacs et
traites dans l'ordre.
Dans un systme mono-utilisateur o les dossiers volumineux, tels que le mdical
ou d'autres images scientifiques, sont stocks, les rayures sont typiquement mis en place
pour tre petit (peut-tre 512 octets) de sorte qu'un seul enregistrement s'tend sur tous
les disques et peut tre consult rapidement par la lecture tous les disques dans le mme
temps.
Dans un systme multi-utilisateur, une meilleure performance ncessite
l'tablissement d'une bande assez large pour dtenir le record de taille typique ou
maximale.
Cela permet chevauchaient E / S disque sur les lecteurs.
Il ya au moins neuf types de RAID ainsi qu'un tableau non redondant (RAID-0):

RAID-0: Cette technique a entrelacement, mais sans redondance des donnes. Il


offre les meilleures performances, mais pas de tolrance aux pannes.

RAID-1: Ce type est galement connu comme miroir de disque et se compose


d'au moins deux disques qui reproduisent le stockage des donnes. Il n'ya pas de
rayures. Lire la performance est amliore puisque soit le disque peut tre lu en
mme temps. Les performances en criture sont les mmes que pour le stockage de
disque unique. RAID-1 fournit les meilleures performances et la meilleure tolrance
aux pannes dans un systme multi-utilisateurs.

RAID-2: Ce type utilise entrelacement sur plusieurs disques avec quelques disques
de stockage de vrification d'erreur et la correction (ECC ) de l'information. Il n'a
aucun avantage sur RAID-3.

RAID-3: Ce type utilise l'entrelacement et consacre un disque stocker la


parit de l'information. La vrification intgre d'erreur (ECC) l'information est utilise
pour dtecter les erreurs. La rcupration des donnes est ralise en calculant le OU
exclusif (XOR) des informations enregistres sur les autres lecteurs. Depuis une

opration d'E / S s'adresse tous les lecteurs dans le mme temps, le RAID-3 ne
peuvent se chevaucher I / O. Pour cette raison, le RAID-3 est le meilleur pour
systmes mono-utilisateur avec les applications d'enregistrement de long.

RAID-4: Ce type utilise des bandes de grandes, ce qui signifie que vous pouvez
lire les enregistrements de n'importe quel lecteur unique. Cela vous permet de
profiter des E / S superposes pour les oprations de lecture. Comme toutes les
oprations d'criture doivent mettre jour le lecteur de parit, pas d'E / S qui se
chevauchent est possible.RAID-4 offre aucun avantage sur RAID-5.

RAID-5: Ce type comprend une gamme de parit tournante, rpondant ainsi la


limitation criture en RAID-4. Ainsi, tous les lire et les oprations d'criture peuvent
tre chevauchs. RAID-5 des informations de parit des magasins, mais pas les
donnes redondantes (mais les informations de parit peut tre utilis pour
reconstruire les donnes). RAID-5 ncessite au moins trois et habituellement cinq
disques de la matrice.Il est prfrable pour les systmes multi-utilisateurs dans
lesquels la performance n'est pas critique ou qui ne les oprations d'criture peu.

RAID-6: Ce type est similaire au RAID-5, mais comporte un rgime de parit


seconde qui est rpartie sur diffrents disques et offre ainsi aux pannes et de trs
haute drive-chec de la tolrance.

RAID-7: Ce type comprend un systme d'exploitation temps rel embarqu en


tant que contrleur, la mise en cache via un bus haute vitesse, et d'autres
caractristiques d'un ordinateur autonome. Un vendeur propose ce systme.

RAID-10: Combinaison RAID-0 et RAID-1 est souvent appel RAID-10, qui offre
des performances suprieures celles RAID-1, mais beaucoup plus de cots. Il ya
deux sous-types: Dans RAID-0 +1, les donnes sont organises en bandes sur
plusieurs disques, puis les jeux de disques rays sont en miroir. Dans RAID-1 0, les
donnes sont en miroir et les miroirs sont rays.

RAID-50 (ou RAID-5 0): Ce type se compose d'une srie de RAID-5 groupes et
bandes en RAID-0 de la mode pour amliorer les performances RAID-5 sans pour
autant rduire la protection des donnes.

RAID-53 (ou RAID-5 3): Ce type utilise entrelacement (en RAID-0 de style) pour
les blocs de RAID-3 du disque virtuel. Cette offre de meilleures performances que
RAID-3, mais un cot beaucoup plus lev.

RAID-S (galement appel RAID Parit): Il s'agit d'une alternative, une mthode
brevete pour la parit RAID ray de stockage EMC Symmetrix qui n'est plus en
usage sur l'quipement actuel. Il semble tre similaire au RAID-5 avec quelques
amliorations de performances ainsi que les amliorations qui viennent d'avoir un
cache disque haute vitesse sur la baie de disques.

You might also like