Vsphere Disponibilité

vSphere Disponibilit
Mise jour 1 ESXi 5.0 vCenter Serveur 5.0
Ce document prend en charge la version de chacun des produits rpertoris, ainsi que toutes les versions publies par la suite jusqu'au remplacement dudit document par une nouvelle dition. Pour rechercher des ditions plus rcentes de ce document, rendezvous sur : http://www.vmware.com/fr/support/pubs.
FR-000848-00
Vous trouverez la documentation technique la plus rcente sur le site Web de VMware l'adresse : http://www.vmware.com/fr/support/pubs/ Le site Web de VMware propose galement les dernires mises jour des produits. Nhsitez pas nous transmettre tous vos commentaires concernant cette documentation ladresse suivante : docfeedback@vmware.com
Copyright 20092012 VMware, Inc. Tous droits rservs. Ce produit est protg par les lois amricaines et internationales relatives au copyright et la proprit intellectuelle. Les produits VMware sont protgs par un ou plusieurs brevets rpertoris l'adresse http://www.vmware.com/go/patents-fr. VMware est une marque dpose ou une marque de VMware, Inc. aux tats-Unis et/ou dans d'autres juridictions. Toutes les autres marques et noms mentionns sont des marques dposes par leurs propritaires respectifs.
VMware, Inc. 3401 Hillview Ave. Palo Alto, CA 94304 www.vmware.com
VMware, Inc. 100-101 Quartier Boieldieu 92042 Paris La Dfense France www.vmware.com/fr
VMware, Inc.
Table des matires
propos de Disponibilit de vSphere 5
1 Continuit d'activit et minimisation des interruptions de service 7

Rduire les interruptions de service prvues 7 Prvenir les interruptions de service imprvues 8 vSphere HA assure une reprise d'activit rapide suite une interruption vSphere Fault Tolerance assure la continuit de la disponibilit 9 8
2 Crer et utiliser des clusters vSphere HA 11
Fonctionnement de vSphere HA 11 Contrle d'admission vSphere HA 16 Liste de vrification de vSphere HA 22 Crer un cluster vSphere HA 23 Personnaliser le comportement de vSphere HA 28 Meilleures pratiques pour les clusters vSphere HA 31
3 Assurer Fault Tolerance des machines virtuelles 37
Fonctionnement de Fault Tolerance 38 Utiliser Fault Tolerance avec DRS 39 Cas d'utilisation de Fault Tolerance 39 Liste de vrification de Fault Tolerance 40 Interoprabilit de Fault Tolerance 42 Prparer votre cluster et vos htes Fault Tolerance 43 Assurer Fault Tolerance des machines virtuelles 47 Afficher des informations sur les machines virtuelles tolrantes aux pannes 49 Pratiques d'excellence pour Fault Tolerance 51 Recommandations de configuration de vSphere Fault Tolerance 53
Index 55
VMware, Inc.
VMware, Inc.
propos de Disponibilit de vSphere
Disponibilit vSphere prsente les solutions permettant d'assurer la continuit d'activit, et explique notamment comment mettre en place vSphere High Availability (HA) et vSphere Fault Tolerance.
Public cibl
Ces informations sont destines tous ceux qui veulent assurer la continuit d'activit l'aide des solutions vSphere HA et Fault Tolerance. Les informations fournies dans ce manuel sont destines aux administrateurs systme Windows ou Linux expriments qui connaissent le fonctionnement de la technologie des machines virtuelles et des centres de donnes.
VMware, Inc.
VMware, Inc.
Continuit d'activit et minimisation des interruptions de service
Qu'elles soient prvues ou imprvues, les interruptions de service engendrent des cots considrables. Cependant les solutions assurant des niveaux levs de disponibilit sont gnralement chres et difficiles implmenter et grer. Les logiciels de VMware assurent facilement et moindre cot un niveau lev de disponibilit pour les applications importantes. Avec vSphere, les entreprises peuvent augmenter facilement le niveau de disponibilit de base assur pour toutes les applications et fournir des niveaux levs de disponibilit plus facilement et moindre frais. Avec vSphere, vous pouvez :
n n n
Assurer une disponibilit leve quels que soient les matriels, le systme d'exploitation et les applications. Rduire les interruptions de service prvues pour les oprations de maintenance ordinaires. Assurer la restauration automatique en cas de dysfonctionnement.
vSphere permet de rduire les interruptions de service prvues, d'viter des interruptions de service imprvues et de rcuprer rapidement suite des interruptions. Ce chapitre aborde les rubriques suivantes :
n n n n
Rduire les interruptions de service prvues , page 7 Prvenir les interruptions de service imprvues , page 8 vSphere HA assure une reprise d'activit rapide suite une interruption , page 8 vSphere Fault Tolerance assure la continuit de la disponibilit , page 9
Rduire les interruptions de service prvues

Les interruptions de service prvues reprsentent gnralement plus de 80 % des interruptions de service d'un centre de donnes. La maintenance matrielle, la migration des serveurs et les mises niveau des microprogramme imposent une interruption du service des serveurs physiques. Pour rduire les rpercussions de ces interruptions de service, les entreprises doivent reporter la maintenance des plages horaires peu pratiques et difficiles planifier. vSphere permet aux entreprises de rduire considrablement les interruptions de service prvues. Comme les charges de travail d'un environnement vSphere peuvent tre dplaces dynamiquement sur diffrents serveurs physiques sans interruptions de service, la maintenance des serveurs peut tre effectue sans exiger une interruption des applications et du service. Avec vSphere, les entreprises peuvent :
n n n
liminer les interruptions de service pour les oprations de maintenance ordinaires. liminer les plages de maintenance prvues. excuter la maintenance tout moment sans perturber les utilisateurs et les services.
VMware, Inc.
vSphere vMotion et la fonctionnalit Storage vMotion de vSphere permettent aux entreprises de rduire les interruptions de service prvues car les charges de travail d'un environnement VMware peuvent tre dplaces dynamiquement sur d'autres serveurs physiques ou sur d'autres stockages sous-jacents sans interruption de service. Les administrateurs peuvent effectuer plus rapidement des oprations de maintenance entirement transparentes, sans devoir planifier des plages de maintenance peu pratiques.
Prvenir les interruptions de service imprvues

Alors qu'un hte ESXi offre une plate-forme stable pour excuter des applications, les entreprises doivent aussi se protger contre les interruptions de service imprvues provoques par des dfaillances matrielles ou logicielles. vSphere renforce considrablement les capacits des infrastructures des centres de donnes, ce qui contribue viter les interruptions de service imprvues. Ces capacits vSphere font partie d'une infrastructure virtuelle et sont transparentes pour le systme d'exploitation et les applications excutes sur les machines virtuelles. Ces fonctions peuvent tre configures et utilises par toutes les machines virtuelles sur un systme physique, ce qui rduit le cot et la complexit de la prvision d'une disponibilit suprieure. Des fonctions cls de disponibilit sont intgres vSphere :
n
Stockage partag. limine des points de panne isols en stockant les fichiers des machines virtuelles dans des espaces de stockage partags, comme Fibre Channel ou iSCSI SAN, ou encore NAS. Il est possible de faire appel aux fonctions de rplication et de mise en miroir SAN pour conserver les copies mises niveau des disques virtuels dans des sites de reprise. Association d'interfaces rseau. Assure la tolrance aux dfaillances des adaptateurs rseau individuelles. chemins multiples du stockage. Assure la tolrance aux dfaillances des emplacements de stockage.
n n
En outre, les fonctions vSphere HA et Fault Tolerance peuvent rduire ou liminer les interruptions de service imprvues en assurant respectivement la reprise rapide de l'activit suite une interruption et la continuit de la disponibilit.
vSphere HA assure une reprise d'activit rapide suite une interruption

vSphere HA a recours plusieurs htes ESXi configurs en cluster pour assurer une reprise d'activit rapide suite une interruption et une haute disponibilit moindres cots pour les applications excutes sur des machines virtuelles. vSphere HA protge la disponibilit des applications de la manire suivante :
n
Il protge contre une dfaillance du serveur en redmarrant les machines virtuelles sur d'autres htes au sein du cluster. Il protge contre les dfaillances des applications en surveillant en permanence une machine virtuelle et en la rinitialisant en cas de dtection d'une dfaillance.
Contrairement aux autres solutions de mise en cluster, vSphere HA fournit l'infrastructure ncessaire la protection de toutes les charges de travail :
n
Il n'est pas ncessaire d'installer des logiciels spciaux dans l'application ou sur la machine virtuelle. Toutes les charges de travail sont protges par vSphere HA. Une fois que vSphere HA est configur, aucune action n'est requise pour protger de nouvelles machines virtuelles. Elles sont protges automatiquement. Vous pouvez associer vSphere HA vSphere Distributed Resource Scheduler (DRS) pour assurer la protection contre les pannes, et pour rpartir la charge entre tous les htes d'un cluster.
VMware, Inc.
Chapitre 1 Continuit d'activit et minimisation des interruptions de service
vSphere HA prsente plusieurs avantages face aux solutions de basculement habituelles : Configuration minimale Quand un cluster vSphere HA a t configur, toutes les machines virtuelles du cluster sont incluses dans le basculement sans configuration supplmentaire. La machine virtuelle fait office de conteneur portable pour les applications et elle peut tre dplace parmi les htes. Les administrateurs vitent ainsi de reproduire les configurations sur plusieurs machines. Lorsque vous utilisez vSphere HA, vous devez disposer de suffisamment de ressources pour le basculement des htes que vous souhaitez protger avec vSphere HA. Toutefois, le systme vCenter Server gre automatiquement les ressources et configure les clusters. Une application excute au sein d'une machine virtuelle a accs une disponibilit accrue. Comme la machine virtuelle peut rcuprer d'une dfaillance matrielle, toutes les applications qui dmarrent au moment de l'initialisation ont une disponibilit accrue sans accrotre la charge de calcul, mme si l'application n'est pas en cluster. En surveillant et en rpondant aux signaux de pulsation de VMware Tools et en redmarrant les machines virtuelles qui ne rpondent plus, elle assure galement une protection contre les dfaillances du systme d'exploitation client. En cas de dfaillance d'un hte et du redmarrage des machines virtuelles sur d'autres htes, DRS peut fournir des recommandations de migration ou faire migrer les machines virtuelle en quilibrant les ressources alloues. Si l'hte source et/ou l'hte de destination d'une migration sont dfaillants, vSphere HA peut faciliter la rcupration suite la dfaillance.
Cots et configuration matrielle rduits
Disponibilit accrue des applications
Intgration DRS et vMotion
vSphere Fault Tolerance assure la continuit de la disponibilit

vSphere HA assure un niveau de protection de base pour vos machines virtuelles en les redmarrant en cas de dfaillance de l'hte. vSphere Fault Tolerance assure un niveau de disponibilit suprieur en permettant aux utilisateurs de protger les machines virtuelles contre une dfaillance de l'hte sans perte de donnes, de transactions ou de connexions. Fault Tolerance assure la continuit de la disponibilit en vrifiant que les tats des machines virtuelles principales et secondaires demeurent identiques tout au long de l'excution des instructions de la machine virtuelle. Ceci s'effectue l'aide de la technologie VMware vLockstep sur la plate-forme de l'hte ESXi. vLockstep s'en assure en faisant excuter des squences d'instructions x86 identiques aux machines virtuelles principales et secondaires. La machine virtuelle principale capture les entres et vnements (en provenance du processeur et destination des priphriques d'E/S virtuels) et les relit sur la machine virtuelle secondaire. La machine virtuelle secondaire excute les mmes instructions que la machine virtuelle principale, alors qu'une seule image de machine virtuelle (la machine virtuelle principale) excute toute la charge de travail. Si l'hte faisant fonctionner la machine virtuelle principale ou l'hte faisant fonctionner la machine virtuelle secondaire est dfaillant, un basculement immdiat et transparent se produit. L'hte ESXi en tat de marche devient la machine virtuelle principale sans qu'il y ait perte des connexions rseau ou des transactions en cours. Le basculement transparent vite toute perte de donnes et assure le maintien des connexions rseau. En cas de basculement transparent, une nouvelle machine virtuelle est raffecte et la redondance est rtablie. Le processus est entirement transparent et automatis et se produit mme en cas d'indisponibilit du vCenter Server.
VMware, Inc.
10
VMware, Inc.
Crer et utiliser des clusters vSphere HA
Les clusters vSphere HA permettent un ensemble d'htes ESXi de travailler conjointement, de faon fournir aux machines virtuelles, en tant que groupe, un niveau de disponibilit suprieur celui d'un seul hte ESXi. Si vous envisagez de crer et d'utiliser un nouveau cluster vSphere HA, les options choisies affectent la manire dont ce cluster ragit aux pannes des htes ou des machines virtuelles. Avant de crer un cluster vSphere HA, vous devez savoir comment vSphere HA identifie les pannes et l'isolation de l'hte et comment il ragit ces situations. Vous devez aussi connatre le mode de fonctionnement du contrle d'admission de faon tre capable de choisir les rgles qui rpondent vos besoins de basculement. Aprs avoir cr un cluster, vous pouvez en personnaliser le comportement avec des attributs avancs et en optimiser les performances en suivant les recommandations. REMARQUE Un message d'erreur peut apparatre lorsque vous essayez d'utiliser vSphere HA. Pour plus d'informations sur les messages d'erreur relatifs vSphere HA, consultez l'article de la base de connaissances VMware sur http://kb.vmware.com/kb/1033634. Ce chapitre aborde les rubriques suivantes :
n n n n n n
Fonctionnement de vSphere HA , page 11 Contrle d'admission vSphere HA , page 16 Liste de vrification de vSphere HA , page 22 Crer un cluster vSphere HA , page 23 Personnaliser le comportement de vSphere HA , page 28 Meilleures pratiques pour les clusters vSphere HA , page 31
Fonctionnement de vSphere HA
vSphere HA assure la disponibilit leve des machines virtuelles en les rassemblant avec leurs htes respectifs dans un cluster. Les htes du cluster sont surveills et, en cas de dfaillance, les machines virtuelles d'un hte dfectueux sont redmarres sur d'autres htes. Lorsque vous crez un cluster vSphere HA, un seul hte est automatiquement slectionn comme hte matre. L'hte matre communique avec vCenter Server et surveille l'tat de toutes les machines virtuelles protges et des htes esclaves. Diffrents types de dfaillances d'htes sont possibles, et l'hte principal doit les dtecter et les traiter de faon adapte. L'hte principal doit faire la diffrence entre un hte dfaillant et un hte se trouvant dans une partition de rseau ou rseau isol. L'hte principal utilise le signal de pulsation de banques de donnes pour dterminer le type de dfaillance.
VMware, Inc.
11
Hte matre et htes esclaves

Lorsque vous ajoutez un hte un cluster vSphere HA, un agent est transfr vers l'hte et configur pour communiquer avec les autres agents du cluster. Chaque hte du cluster fonctionne en tant qu'hte principal (matre) ou hte secondaire (esclave). Lorsque vSphere HA est activ pour un cluster, tous les htes actifs (ceux qui ne sont pas en mode standby ou maintenance, ou qui ne sont pas dconnects) participent au choix de l'hte principal du cluster. L'hte contenant le plus grand nombre de banques de donnes a l'avantage pour tre choisi. Il n'existe qu'un hte principal par cluster. Tous les autres sont des htes secondaires. Si l'hte principal est dfaillant, ferm, ou est supprim du cluster, un nouvel hte principal doit tre choisi. L'hte principal d'un cluster a un certain nombre de responsabilits :
n
Surveiller l'tat des htes secondaires. Si un hte secondaire est dfaillant ou devient inaccessible, l'hte principal identifie les machines virtuelles qui doivent tre redmarres. Surveiller l'tat d'alimentation de toutes les machines virtuelles protges. Si une machine virtuelle est dfaillante, l'hte principal s'assure qu'elle est redmarre. Grce un moteur de placement local, l'hte principal dtermine galement o le redmarrage doit avoir lieu. Grer les listes d'htes et de machines virtuelles protges du cluster. Servir d'interface de gestion vCenter Server du cluster et rendre compte de l'tat de sant du cluster.
n n
Les htes secondaires apportent une contribution essentielle au cluster en excutant des machines virtuelles localement, en surveillant leur tat d'excution et en communiquant les mises jour d'tat l'hte principal. Un hte principal peut galement excuter et surveiller des machines virtuelles. Les htes principaux et les htes secondaires mettent en uvre les fonctions de surveillance de VM et d'application. La protection des machines virtuelles est l'une des fonctions de l'hte principal. Lorsqu'une machine virtuelle est protge, vSphere HA doit essayer de la remettre sous tension en cas de dfaillance. Un hte principal s'engage protger une machine virtuelle lorsqu'il constate que son tat d'alimentation passe de hors tension sous tension suite une action d'un utilisateur. En cas de basculement, l'hte principal doit redmarrer les machines virtuelles qui sont protges et dont il est responsable. Cette responsabilit est attribue l'hte principal qui a bloqu exclusivement un fichier dfini par le systme sur la banque de donnes contenant un fichier de configuration de machine virtuelle. vCenter Server indique si un hte est principal ou secondaire l'aide de l'tat d'hte vSphere HA. Cet tat figure dans l'onglet [Rsum] de l'hte dans vSphere Client et dans la vue Liste des htes d'un cluster ou d'une banque de donnes, si la colonne tat HA a t active. L'tat HA En cours d'excution (Principal) indique que l'hte fonctionne en tant qu'hte principal vSphere HA. L'tat Connect (Secondaire) indique que l'hte fonctionne en tant qu'hte secondaire vSphere HA. Il existe plusieurs autres tats pour indiquer qu'un choix est en cours ou qu'une erreur s'est produite. L'onglet [Rsum] de l'hte fournit un lien, ct de l'tat vSphere HA de l'hte, expliquant l'tat actuel. Pour plus d'informations sur les tats d'erreur, consultez la documentation Dpannage vSphere. REMARQUE Si vous dconnectez un hte d'un cluster, aucune des machines virtuelles enregistres sur cet hte n'est protge par vSphere HA.
Types de pannes des htes et dtection

L'hte principal d'un cluster vSphere HA est responsable de la dtection des pannes des htes secondaires. Selon le type de panne dtect, les machines virtuelles excutes sur les htes peuvent ncessiter un basculement. Dans un cluster vSphere HA, trois types de pannes d'htes sont dtects :
n
Un hte cesse de fonctionner (autrement dit, il est dfaillant).
12
VMware, Inc.
Chapitre 2 Crer et utiliser des clusters vSphere HA
n n
Un hte est rseau isol. Un hte perd sa connexion rseau avec l'hte principal.
L'hte principal surveille la ractivit des htes secondaires du cluster. Cette communication s'effectue par l'change, toutes les secondes, de signaux de pulsation rseau. Lorsqu'un hte principal cesse de recevoir des signaux de pulsation d'un hte secondaire ou esclave, il vrifie la ractivit de l'hte avant de le dclarer dfaillant. Le contrle de ractivit effectu par l'hte principal permet de dterminer si l'hte secondaire change des signaux de pulsation avec une des banques de donnes. Reportez-vous la section Signal de pulsation de banque de donnes , page 14. Par ailleurs, l'hte principal vrifie si l'hte rpond aux pings ICMP envoys ses adresses IP de gestion. Si un hte principal est incapable de communiquer directement avec l'agent prsent sur un hte secondaire, si l'hte secondaire ne rpond pas aux pings ICMP, et si l'agent n'met pas de signaux de pulsation, il est considr comme dfaillant. Les machines virtuelles des htes sont redmarres sur d'autres htes. Si un tel hte secondaire change des signaux de pulsation avec une banque de donnes, l'hte principal considre qu'il se trouve dans une partition de rseau ou qu'il est rseau isol, et continue donc de surveiller l'hte et ses machines virtuelles. Reportez-vous la section Partitions de rseau , page 13. L'isolation du rseau de l'hte survient lorsqu'un hte, toujours en cours d'excution, ne parvient plus observer le trafic provenant des agents vSphere HA sur le rseau de gestion. Si un hte cesse d'observer ce trafic, il tente d'envoyer un ping aux adresses d'isolation du cluster. Si cela choue aussi, l'hte se dclare isol du rseau. L'hte principal surveille les machines virtuelles excutes sur un hte isol. S'il constate qu'elles s'arrtent, et s'il est responsable de ces machines virtuelles, il les redmarre. REMARQUE Si vous vous assurez que l'infrastructure rseau est suffisamment redondante et qu'un chemin d'accs au rseau est disponible en permanence, l'isolation du rseau de l'hte devrait se produire trs rarement.
Partitions de rseau
En cas de dfaillance du rseau de gestion d'un cluster vSphere HA, un sous-ensemble d'htes du cluster risque d'tre incapable de communiquer avec les autres htes sur le rseau de gestion. De multiples partitions peuvent se produire dans un cluster. Un cluster partitionn entrane une diminution de la protection des machines virtuelles et une altration des fonctions de gestion du cluster. Rparez le cluster partitionn ds que possible.
n
Protection des machines virtuelles. vCenter Server permet de mettre sous tension une machine virtuelle, mais celle-ci n'est protge que si elle s'excute sur la mme partition que l'hte principal qui en est responsable. L'hte principal doit communiquer avec vCenter Server. Un hte principal est responsable d'une machine virtuelle s'il a bloqu exclusivement un fichier dfini par le systme sur la banque de donnes contenant le fichier de configuration de la machine virtuelle. Gestion des clusters. vCenter Server ne peut communiquer qu'avec certains htes du cluster, et ne peut se connecter qu' un hte principal. Par consquent, il se peut que les modifications de configuration relatives vSphere HA ne prennent pas effet tant que le problme de partition n'est pas rsolu. Suite cette dfaillance, une des partitions pourrait s'excuter selon l'ancienne configuration, tandis qu'une autre utiliserait les nouveaux paramtres.
En cas de partition d'un cluster vSphere HA contenant des htes antrieurs ESXi 5.0, il se peut que vSphere HA mette sous tension, tort, une machine virtuelle qui avait t mise hors tension par l'utilisateur ou n'arrive pas redmarrer une machine virtuelle dfaillante. REMARQUE Lorsqu'un cluster vSphere HA est partitionn, vous ne pouvez ajouter un hte que sur la partition avec laquelle vCenter Server communique.
VMware, Inc.
13
Signal de pulsation de banque de donnes

Lorsque l'hte principal d'un cluster vSphere HA ne peut pas communiquer avec un hte secondaire sur le rseau de gestion, l'hte principal utilise le signal de pulsation de banque de donnes pour dterminer si l'hte secondaire est dfaillant, s'il se trouve dans une partition de rseau ou s'il est rseau isol. Si l'hte secondaire a arrt le signal de pulsation de banque de donnes, il est considr comme dfaillant et ses machines virtuelles sont redmarres ailleurs. vCenter Server slectionne un ensemble de banques de donnes prfres pour le signal de pulsation. Cette slection a pour but d'optimiser le nombre d'htes ayant accs une banque de donnes signal de pulsation et de minimiser le risque que les banques de donnes rsident sur la mme baie de stockage ou le mme serveur NFS. Pour remplacer une banque de donnes slectionne, utilisez la bote de dialogue Paramtres de cluster de vSphere Client pour spcifier les banques de donnes signal de pulsation. L'onglet [Signal de pulsation de banques de donnes] vous permet de spcifier d'autres banques de donnes. Seules les banques de donnes fonctionnant avec au moins deux htes sont disponibles. Vous pouvez galement voir les banques de donnes slectionnes par vSphere HA en affichant l'onglet [Banques de donnes signal de pulsation] de la bote de dialogue tat du cluster HA. Vous pouvez utiliser l'attribut avanc das.heartbeatdsperhost pour modifier le nombre de banques de donnes signal de pulsation slectionn par vCenter Server pour chaque hte. La valeur par dfaut est deux et la valeur maximale est cinq. vSphere HA cre un rpertoire la racine de chaque banque de donnes qui sert la fois au signal de pulsation de banques de donnes et maintenir l'ensemble des machines virtuelles protges. Le nom de ce rpertoire est .vSphere-HA. Vous ne devez ni supprimer ni modifier les fichiers stocks dans ce rpertoire car cela peut avoir des rpercussions sur les oprations. Plusieurs clusters peuvent utiliser une banque de donnes. Des sous-rpertoires sont donc crs dans ce rpertoire pour chaque cluster. Ces rpertoires et fichiers font partie de la racine, et seule celle-ci peut les lire et les modifier. L'espace disque utilis par vSphere HA dpend de plusieurs facteurs, notamment la version de VMFS et le nombre d'htes qui utilisent la banque de donnes pour le signal de pulsation. Avec vmfs3, l'utilisation maximale est d'environ 2 Go et l'utilisation type est d'environ 3 Mo. Avec vmfs5, l'utilisation normale maximale est d'environ 3 Mo. L'utilisation vSphere HA de la banque de donnes ajoute une charge additionnelle ngligeable et n'a pas d'impact sur la performance des autres oprations de la banque de donnes.
Scurit vSphere HA
Plusieurs fonctions de scurit permettent d'amliorer vSphere HA. Slectionner les ports de pare-feu ouverts Fichiers de configuration protgs par les autorisations du systme de fichiers Journalisation dtaille vSphere HA utilise les ports 8182 TCP et UDP pour la communication d'agent agent. Les ports de pare-feu s'ouvrent et se ferment automatiquement pour assurer qu'ils sont ouverts uniquement lorsque cela est ncessaire. vSphere HA stocke les informations de configuration sur le systme de stockage local ou sur le ramdisk s'il n'existe aucune banque de donnes locale. Ces fichiers sont protgs par les autorisations du systme de fichiers et sont accessibles uniquement par l'utilisateur racine. L'emplacement des fichiers journaux choisi par vSphere HA dpend de la version de l'hte.
n
Pour les htes ESXi 5.x, vSphere HA crit sur syslog uniquement par dfaut. Les journaux sont donc placs l'endroit indiqu dans la configuration de syslog. Les noms des fichiers journaux de vSphere HA sont prcds de fdm, fault domain manager (gestionnaire de domaine de pannes), qui est un service de vSphere HA.
14
VMware, Inc.
Pour les htes hrits ESXi 4.x et 3.x, vSphere HA crit sur /var/log/vmware/fdm sur le disque local, ainsi que sur syslog s'il est configur. Pour les htes hrits ESX 4.x et 3.x, vSphere HA crit sur /var/log/vmware/fdm.
Connexions vSphere HA scurises
vSphere HA se connecte aux agents vSphere HA l'aide d'un compte d'utilisateur, vpxuser, cr par vCenter Server. Ce compte est le mme que celui utilis par vCenter Server pour grer l'hte. vCenter Server cre un mot de passe de faon alatoire pource compte et le change rgulirement. La frquence de renouvellement du mot de passe est dfinie par le paramtre VirtualCenter.VimPasswordExpirationInDays de vCenter Server. Vous pouvez modifier ce paramtre l'aide de la commande Paramtres avancs de vSphere Client. Les utilisateurs ayant des privilges d'administration sur le dossier racine de l'hte peuvent galement se connecter l'agent. Toutes les communications entre vCenter Server et l'agent vSphere HA sont scurises par SSL. La communication d'agent agent utilise galement le protocole SSL sauf pour les messages d'lection, qui utilisent UDP. Les messages d'lection sont vrifis via SSL de sorte qu'un agent non autoris puisse empcher uniquement l'hte sur lequel l'agent s'excute d'tre choisi comme hte principal. Dans ce cas, un problme de configuration du cluster est mis afin que l'utilisateur soit inform du problme. vSphere HA exige que chaque hte dispose d'un certificat SSL vrifi. Chaque hte gnre un certificat auto-sign lors de son premier dmarrage. Ce certificat peut tre gnr une nouvelle fois ou remplac par un certificat mis par une autorit. Si le certificat est remplac, vSphere HA doit tre reconfigur sur l'hte. Si un hte se dconnecte de vCenter Server aprs la mise jour de son certificat et si l'agent de l'hte ESXi ou ESX est redmarr, vSphere HA est automatiquement reconfigur au moment o l'hte est reconnect vCenter Server. Si la dconnexion n'est pas due au fait que la vrification du certificat SSL de l'hte de vCenter Server est dsactive ce moment-l, vrifiez le nouveau certificat et reconfigurez vSphere HA sur l'hte.
Communication scurise
Vrification du certificat SSL de l'hte requise
Utilisation conjointe de vSphere HA et DRS

L'utilisation de vSphere HA avec Distributed Resource Scheduler (DRS) allie le basculement automatique l'quilibrage de la charge. Cette association peut aboutir un cluster mieux quilibr une fois que vSphere HA a dplac les machines virtuelles sur d'autres htes. Quand vSphere HA excute le basculement et redmarre les machines virtuelles sur des htes diffrents, sa premire priorit est la disponibilit immdiate de toutes les machines virtuelles. Aprs le redmarrage des machines virtuelles, les htes sur lesquels elles sont mises sous tension peuvent se retrouver surchargs, tandis que la charge d'autres htes est, en comparaison, plus lgre. vSphere HA utilise le CPU et la rservation de mmoire de la machine virtuelle pour dterminer si un hte dispose de suffisamment de capacit disponible pour prendre en charge la machine virtuelle. Dans un cluster utilisant DRS et vSphere HA avec le contrle d'admission activ, les machines virtuelles ne sont pas ncessairement vacues des htes passant en mode maintenance. Ce comportement intervient par suite des ressources rserves pour le redmarrage des machines virtuelles en cas de panne. Il faut migrer manuellement les machines virtuelles en dehors des htes avec vMotion.
VMware, Inc.
15
Dans certains cas, vSphere HA ne parvient pas basculer les machines virtuelles en raison de contraintes de ressources. Ceci peut se produire pour plusieurs raisons.
n
Le contrle d'admission HA est dsactiv et Gestion de l'alimentation distribue (DPM) est activ. Cela peut aboutir la consolidation par DPM des machines virtuelles sur un nombre infrieur d'htes et la mise en veille des htes vides, ce qui ne laisse pas suffisamment de rserve de capacit active pour effectuer un basculement. Les rgles (requises) d'affinit de machine virtuelle/hte peuvent limiter les htes sur lesquels certaines machines virtuelles peuvent tre places. Il peut y avoir suffisamment de ressources cumules mais celles-ci sont fragmentes sur plusieurs htes de sorte qu'elles ne peuvent pas tre utilises par les machines virtuelles pour le basculement.
Dans ces cas-l, vSphere HA peut utiliser DRS pour essayer d'ajuster le cluster (par exemple, en sortant les htes du mode veille ou en migrant les machines virtuelles pour dfragmenter les ressources du cluster) de sorte que HA puisse excuter les basculements. Si DPM est en mode manuel, vous devrez ventuellement confirmer les recommandations de mise sous tension des htes. De mme, si DPM est en mode manuel, vous devrez ventuellement confirmer les recommandations de migration. Si vous utilisez les rgles d'affinit entre machine virtuelle et hte requises, sachez que ces rgles doivent obligatoirement tre respectes. vSphere HA n'effectue pas de basculement si cela risque d'enfreindre une rgle. Pour plus d'informations sur DRS, consultez la documentation Gestion des ressources vSphere.
Contrle d'admission vSphere HA

vCenter Server utilise le contrle d'admission pour assurer que suffisamment de ressources sont disponibles dans un cluster pour permettre la protection par basculement et pour assurer que les rservations de ressources pour les machines virtuelles sont respectes. Trois types de contrle d'admission sont disponibles. Hte Pool de ressources Garantit qu'un hte dispose de suffisamment de ressources pour satisfaire les rservations de toutes les machines virtuelles qui y sont excutes. Garantit qu'un pool de ressources dispose de suffisamment de ressources pour satisfaire les rservations, les partages et les limites de toutes les machines virtuelles qui y sont associes. Garantit qu'une part suffisante des ressources du cluster sont rserves la restauration des machines virtuelles en cas de dfaillance de l'hte.
vSphere HA
Le contrle d'admission impose des contraintes d'utilisation des ressources et toute action contrevenant ces contraintes n'est pas autorise. Parmi les exemples d'actions qui peuvent tre interdites, on peut citer :
n n n
la mise sous tension d'une machine virtuelle. la migration d'une machine virtuelle sur un hte ou dans un cluster ou un pool de ressources. l'augmentation de la rserve de CPU ou de mmoire d'une machine virtuelle.
Parmi les trois types de contrle d'admission, seul le contrle d'admission vSphere HA peut tre dsactiv. Cependant, sans ce contrle, il est impossible de garantir que le nombre de machines virtuelles attendu puisse tre redmarr aprs une dfaillance. VMware dconseille de mettre hors tension le contrle d'admission, mais vous pouvez avoir besoin de le faire temporairement pour les raisons suivantes :
n
Si vous devez enfreindre les contraintes de basculement lorsqu'il n'y a pas suffisamment de ressources pour les prendre en charge (par exemple, si vous mettez les htes en mode veille pour en tester le fonctionnement avec DPM).
16
VMware, Inc.
Si un processus automatis doit effectuer des actions qui risquent d'enfreindre temporairement les contraintes de basculement (par exemple, dans le cadre d'une mise niveau dirige par vSphere Update Manager). Si vous devez excuter des tests ou des oprations de maintenance.
REMARQUE Lorsque le contrle d'admission vSphere HA est dsactiv, vSphere HA garantit qu'au moins deux htes du cluster sont sous tension mme si DPM est activ et peut regrouper toutes les machines virtuelles sur un seul hte. Ceci permet de garantir que le basculement est possible.
Rgles de contrle d'admission Dfaillances d'hte tolres par le cluster

Vous pouvez configurer vSphere HA pour qu'il tolre un nombre dfini de dfaillances d'htes. Avec les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster, vSphere HA s'assure que mme si un nombre d'htes spcifi est dfaillant, les ressources demeurent en quantit suffisante sur le cluster pour permettre le basculement de toutes les machines virtuelles de ces htes. Avec les rgles Dfaillances d'hte tolres par le cluster, vSphere HA effectue le contrle d'admission de la manire suivante : 1 Calcule la taille du slot. Un slot est une reprsentation logique de la mmoire et des ressources CPU. Par dfaut, il est dimensionn pour satisfaire aux exigences de chaque machine virtuelle sous tension dans le cluster. 2 3 Dtermine le nombre de slots pouvant se trouver sur chaque hte du cluster. Dtermine la Capacit de basculement actuelle du cluster. Il s'agit du nombre d'htes dfectueux permettant de conserver un nombre suffisant de slots pour satisfaire toutes les machines virtuelles sous tension. 4 Dtermine si la Capacit de basculement actuelle est infrieure ou non la Capacit de basculement configure (prcise par l'utilisateur). Si c'est le cas, le contrle d'admission n'autorise pas l'opration.
Calcul de la taille du slot

La taille d'un slot est dtermine par deux composants, le CPU et la mmoire.
n
vSphere HA calcule la taille de CPU partir du CPU rserv par chaque machine virtuelle sous tension, en slectionnant la valeur la plus leve. Si aucun CPU n'a t rserv pour une machine virtuelle, une valeur de 32 MHz est dfinie par dfaut. Cette valeur peut tre modifie par l'attribut avanc das.vmcpuminmhz.) vSphere HA calcule la taille de la mmoire partir de la mmoire rserve (plus la capacit supplmentaire de mmoire) de chaque machine virtuelle sous tension, en slectionnant la valeur la plus leve. Il n'y a pas de valeur par dfaut pour la mmoire rserve.
Si le cluster contient des machines virtuelles ayant des valeurs de rservation bien plus leves que d'autres, celles-ci influeront sur le calcul de la taille du slot. Pour viter cela, vous pouvez prciser une limite suprieure pour le CPU ou le composant de mmoire de la taille du slot en utilisant respectivement les attributs avancs das.slotcpuinmhz ou das.slotmeminmb. Reportez-vous Attributs avancs de vSphere HA , page 29.
Utiliser les slots pour dterminer la capacit de basculement actuelle

Une fois la taille du slot calcule, vSphere HA dtermine les ressources de CPU et de mmoire disponibles sur chaque hte pour les machines virtuelles. Ces valeurs sont celles contenues dans le pool de ressources racine de l'hte, et non dans les ressources physiques totales de l'hte. Vous pouvez trouver les donnes de ressources d'un hte utilis par vSphere HA en vous connectant directement cet hte via vSphere Client, puis en accdant
VMware, Inc.
17
l'onglet [Ressources] de l'hte. Si tous les htes de votre cluster sont identiques, vous pouvez obtenir ces donnes en divisant les chiffres relatifs au cluster dans son ensemble par le nombre d'htes. Les ressources utilises des fins de virtualisation ne sont pas incluses. Seuls les htes qui sont connects, qui ne sont pas en mode maintenance et qui ne prsentent pas d'erreurs vSphere HA sont pris en compte. Le nombre maximum de slots pouvant tre pris en charge par chaque hte est alors dtermin. cette fin, la quantit de ressources CPU de l'hte est divise par le composant de CPU de la taille de slot et le rsultat est arrondi. Le mme calcul est fait pour la quantit de ressources de mmoire de l'hte. Ces deux valeurs sont compares et la plus basse quivaut au nombre de slots pouvant tre pris en charge par l'hte. La Capacit de basculement actuelle est calcule en dterminant le nombre d'htes (en commenant par le plus gros) pouvant tre dfectueux tout en conservant un nombre suffisant de slots pour satisfaire toutes les machines virtuelles sous tension.
Informations d'excution avances

Lorsque vous slectionnez les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster, le lien [Informations d'excution avances] apparat dans la rubrique vSphere HA de l'onglet [Rsum] du cluster dans vSphere Client. Cliquez sur ce lien pour afficher les informations suivantes propos du cluster :
n n
Taille du slot. Nombre total de slots dans le cluster. Somme des slots pris en charge par les htes en tat de marche dans le cluster. Slots utiliss. Nombre de slots associs aux machines virtuelles sous tension. Ce nombre peut tre suprieur au nombre de machines virtuelles sous tension si vous avez dfini une limite suprieure pour la taille du slot au moyen des options avances. Ceci parce que quelques machines virtuelles peuvent occuper plusieurs slots. Slots disponibles Nombre de slots disponibles pour mettre sous tension des machines virtuelles supplmentaires dans le cluster. vSphere HA rserve le nombre de slots requis pour le basculement. Les slots restants sont disponibles pour mettre sous tension de nouvelles machines virtuelles. Slots de basculement. Nombre total de slots l'exception des slots utiliss ou des slots disponibles. Nombre total de machines virtuelles sous tension dans le cluster. Nombre total d'htes dans le cluster. Nombre total d'htes en marche dans le cluster. Nombre d'htes qui sont connects, qui ne sont pas en mode maintenance et qui ne prsentent pas d'erreurs vSphere HA.
n n n n
Exemple : Rgles de contrle d'admission Dfaillances d'hte tolres par le cluster

Nous allons illustrer par un exemple le mode de calcul de la taille de slot et son utilisation avec cette rgle de contrle d'admission. Prenons les hypothses suivantes pour un cluster :
n
Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources mmoire disponibles. Le premier hte (H1) a 9 Ghz de ressources CPU et 9 Go de mmoire disponibles. Le second (H2) a 9 Ghz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 Ghz de CPU et 6 Go de mmoire disponibles. Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire diffrents. VM1 a besoin de 2 Ghz de ressources CPU et 1 Go de mmoire, tandis que VM2 a besoin de 2 Ghz et 1 Go, VM3 a besoin de 1 Ghz et de 2 Go, VM4 a besoin de 1 Ghz et 1 Go, VM5 a besoin de 1 Ghz et 1 Go. Les dfaillances d'hte tolres par le cluster sont dfinies sur la valeur 1.
18
VMware, Inc.
Figure 2-1. Exemple de contrle d'admission avec des rgles de Dfaillances d'hte tolres par le cluster
VM1 2 Ghz 1 Go
VM2 2 Ghz 1 Go
VM3 1 Ghz 2 Go taille du slot 2 Ghz, 2 Go
VM4 1 Ghz 1 Go
VM5 1 Ghz 1 Go
H1 9 Ghz 9 Go 4 slots
6 slots restants Si H1 est dfectueux

1 La taille du slot est calcule en comparant la fois les exigences de CPU et de mmoire des machines virtuelles et en slectionnant la plus leve. Le besoin en CPU le plus lev (partag par VM1 et VM2) est de 2 Ghz, tandis que le besoin en mmoire le plus lev (VM3) est de 2 Go. Partant de l, la taille du slot se compose d'un CPU de 2 Ghz et d'une mmoire de 2 Go. 2 Le nombre maximum de slots pouvant tre pris en charge par chaque hte est dtermin. H1 peut prendre en charge quatre slots. H2 peut prendre en charge trois slots (le plus bas de 9 Ghz/2 Ghz et 6 Go/2 Go) et H3 peut aussi en prendre en charge trois. 3 La Capacit de basculement actuelle est calcule. Le plus gros hte est H1 et s'il est dfectueux, le cluster contient toujours six slots, ce qui est suffisant pour les cinq machines virtuelles sous tension. Si H1 et H2 sont dfectueux, il ne reste que trois slots, ce qui est insuffisant. Par consquent, la Capacit de basculement actuelle est de 1. Le cluster a un slot disponible (les six slots de H2 et H3 moins les cinq slots utiliss).
Rgles de contrle d'admission Pourcentage de ressources de cluster rserves

Il est possible de configurer vSphere HA pour effectuer le contrle d'admission en rservant un pourcentage spcifique de ressources de CPU et de mmoire du cluster la rcupration en cas de pannes d'htes. Les rgles de contrle d'admission Pourcentage de ressources de cluster rserves permettent vSphere HA de rserver au basculement un pourcentage spcifi de ressources cumules de CPU et de mmoire du cluster. vSphere HA met en uvre le contrle d'admission conformment aux rgles de Ressources de cluster rserves suivantes : 1 2 3 Calcule les besoins totaux en ressources pour toutes les machines virtuelles sous tension dans le cluster. Calcule les ressources totales de l'hte disponibles pour les machines virtuelles. Calcule la Capacit CPU de basculement actuelle et la Capacit mmoire de basculement actuelle du cluster.
VMware, Inc.
19
Dtermine si la Capacit de basculement de CPU actuelle ou la Capacit de basculement mmoire actuelle sont infrieures ou non la Capacit de basculement configure correspondante (spcifie par l'utilisateur). Si c'est le cas, le contrle d'admission n'autorise pas l'opration.
vSphere HA utilise les rserves effectives des machines virtuelles. Si une machine virtuelle n'a pas de rserves, c'est--dire que la valeur de rserve est nulle, les valeurs utilises par dfaut sont 0 Mo de mmoire et 32 MHz de CPU. REMARQUE Les rgles de contrle d'admission Pourcentage de ressources de cluster rserves vrifient galement qu'il existe au moins deux htes compatibles vSphere HA dans le cluster ( l'exception des htes qui passent en mode maintenance). S'il n'y a qu'un hte compatible vSphere HA, aucune opration n'est autorise, mme si le pourcentage de ressources disponibles est suffisant. Cette vrification supplmentaire s'explique par le fait que vSphere HA ne peut pas effectuer de basculement s'il n'y a qu'un seul hte dans le cluster.
Calcul de la Capacit de basculement actuelle

Les ressources totales requises par les machines virtuelles sous tension incluent deux composants, CPU et mmoire. vSphere HA calcule ces valeurs.
n
Le besoin en composant CPU est obtenu en additionnant le CPU rserv par les machines virtuelles sous tension. Si aucun CPU n'a t rserv pour une machine virtuelle, une valeur de 32 MHz est dfinie par dfaut (cette valeur peut tre modifie par l'attribut avanc das.vmcpuminmhz). La taille du composant de mmoire est obtenue en additionnant la mmoire rserve (plus la capacit supplmentaire de mmoire) de chaque machine virtuelle sous tension.
Les ressources totales des htes disponibles pour les machines virtuelles sont calcules en additionnant les ressources de CPU et de mmoire des htes. Ces valeurs sont celles contenues dans le pool de ressources racine de l'hte, et non dans les ressources physiques totales de l'hte. Les ressources utilises des fins de virtualisation ne sont pas incluses. Seuls les htes qui sont connects, qui ne sont pas en mode maintenance et qui ne prsentent pas d'erreurs vSphere HA sont pris en compte. La Capacit CPU de basculement actuelle est calcule en soustrayant les besoins totaux en ressources CPU des ressources CPU totales des htes et en divisant le rsultat par les ressources CPU totales des htes. La Capacit mmoire de basculement actuelle est calcule de la mme manire.
Exemple : Rgles de contrle d'admission Pourcentage de ressources de cluster rserves

Nous allons illustrer par un exemple le mode de calcul de la Capacit de basculement actuelle et son utilisation avec cette rgle de contrle d'admission. Prenons les hypothses suivantes pour un cluster :
n
Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources mmoire disponibles. Le premier hte (H1) a 9 Ghz de ressources CPU et 9 Go de mmoire disponibles. Le second (H2) a 9 Ghz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 Ghz de CPU et 6 Go de mmoire disponibles. Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire diffrents. VM1 a besoin de 2 Ghz de ressources CPU et 1 Go de mmoire, tandis que VM2 a besoin de 2 Ghz et 1 Go, VM3 a besoin de 1 Ghz et de 2 Go, VM4 a besoin de 1 Ghz et 1 Go, VM5 a besoin de 1 Ghz et 1 Go. La Capacit de basculement configure est de 25 %.
20
VMware, Inc.
Figure 2-2. Exemple de contrle d'admission utilisant les rgles de Pourcentage de ressources de cluster rserves
VM1 2 Ghz 1 Go
VM2 2 Ghz 1 Go
VM3 1 Ghz 2 Go
VM4 1 Ghz 1 Go
VM5 1 Ghz 1 Go
besoins totaux en ressources 7 Ghz, 6 Go H1 9 Ghz 9 Go H2 9 Ghz 6 Go H3 6 Ghz 6 Go
ressources totales de l'hte 24 GHz, 21 Go

Les besoins totaux en ressources des machines virtuelles sous tension sont de 7 Ghz et 6 Go. Les ressources totales de l'hte disponibles pour les machines virtuelles sont de 24 Ghz et 21 Go. Partant de l, la Capacit CPU de basculement actuelle s'lve 70% ((24 Ghz - 7 Ghz)/24 Ghz). De mme, la Capacit mmoire de basculement actuelle s'lve 71% ((21 Go - -6 Go)/21 Go). Comme la Capacit de basculement configure pour le cluster est de 25 %, 45 % des ressources CPU totales du cluster et 46 % des ressources mmoire totales du cluster sont toujours disponibles pour les machines virtuelles supplmentaires.
Rgles de contrle d'admission Spcifier des htes de basculement

Il est possible de configurer vSphere HA afin de dsigner des htes spcifiques comme htes de basculement. En cas de dfaillance d'un hte, les rgles de contrle d'admission Spcifier des htes de basculement prvoient que vSphere HA tente de redmarrer ses machines virtuelles sur un des htes de basculement prdfinis. Si ce n'est pas possible car les htes de basculement sont eux-mme en panne ou leurs ressources sont insuffisantes, par exemple, vSphere HA tente de redmarrer ces machines virtuelles sur d'autres htes du cluster. Pour que des capacits restent disponibles sur un hte de basculement, vous ne pouvez pas mettre sous tension des machines virtuelles ni utiliser vMotion pour faire migrer des machines virtuelles vers un hte de basculement. De plus, DRS n'utilise pas d'hte de basculement pour la rpartition de la charge. REMARQUE Si vous utilisez les rgles de contrle d'admission Spcifier des htes de basculement et dsignez plusieurs htes de basculement, DRS ne rpartit pas la charge des htes de basculement et les rgles d'affinit VM-VM ne sont pas prises en charge. Les Htes de basculement actuels apparaissent dans la section vSphere HA de l'onglet [Rsum] du cluster dans vSphere Client. L'icne de statut qui se trouve ct de chaque hte peut tre verte, jaune ou rouge.
n
Vert. L'hte est connect, il n'est pas en mode maintenance et ne prsente pas d'erreurs vSphere HA. Aucune machine virtuelle sous tension ne rside sur l'hte. Jaune. L'hte est connect, il n'est pas en mode maintenance et ne prsente pas d'erreurs vSphere HA. Mais des machines virtuelles sous tension rsident sur l'hte. Rouge. L'hte est dconnect, il est en mode maintenance ou prsente des erreurs vSphere HA.
VMware, Inc.
21
Choisir une rgle de contrle d'admission

Les rgles de contrle d'admission de vSphere HA doivent tre choisies en fonction des besoins de disponibilit et des caractristiques du cluster. Diffrents critres doivent tre pris en compte lors du choix des rgles de contrle d'admission.
viter la fragmentation des ressources

La fragmentation des ressources se produit lorsqu'il y a suffisamment de ressources cumules pour le basculement d'une machine virtuelle. Toutefois, ces ressources sont rparties sur plusieurs htes et sont inutilisables car une machine virtuelle ne peut tre excute que sur un seul hte ESXi la fois. Les rgles de Dfaillances d'hte tolres par le cluster vitent la fragmentation des ressources en dfinissant un slot comme la rserve maximale des machines virtuelles. Les rgles de Pourcentage de ressources de clusters ne traitent pas du problme de la fragmentation des ressources. Les rgles Spcifier des htes de basculement n'entranent pas la fragmentation des ressources car des htes sont rservs au basculement.
Flexibilit de la rservation des ressources de basculement

Les rgles de contrle d'admission diffrent de par la granularit qu'elles accordent au moment de la rservation des ressources du cluster pour la protection du basculement. Les rgles Dfaillances d'hte tolres par le cluster permettent de dfinir le niveau de basculement d'un certain nombre d'htes. Les rgles Pourcentage de ressources de cluster permettent d'attribuer jusqu' 100 % des ressources de CPU ou de mmoire du cluster pour le basculement. Les rgles Spcifier un hte de basculement permettent de spcifier un ensemble d'htes de basculement.
Htrognit des clusters

Les clusters peuvent tre htrognes en termes de rservations des ressources des machines virtuelles et de capacits des ressources totales des htes. Dans un cluster htrogne, les rgles de Dfaillances d'hte tolres par le cluster peuvent tre insuffisantes puisqu'elles tiennent uniquement compte des plus grosses rserves de machines virtuelles lors de la dfinition de la taille du slot et qu'elles envisagent uniquement la dfaillance du plus gros hte lors de l'estimation de la Capacit de basculement actuelle. Les deux autres rgles de contrle d'admission ne sont pas affectes par l'htrognit des clusters. REMARQUE vSphere HA tient compte de l'utilisation des ressources des machines virtuelles secondaires tolrantes aux pannes dans les calculs de contrle d'admission. Les rgles de Dfaillances d'hte tolres par le cluster veulent qu'un slot soit affect une machine virtuelle secondaire, tandis que les rgles de Pourcentage de ressources de clusters prvoient que l'utilisation des ressources des machines virtuelles secondaires soit prise en compte lors de l'valuation de l'utilisation des ressources du cluster.
Liste de vrification de vSphere HA

La liste de vrification de vSphere HA contient les spcifications que vous devez connatre pour pouvoir crer et utiliser un cluster vSphere HA.
Spcifications applicables un cluster vSphere HA

Consultez cette liste avant de configurer un cluster vSphere HA. Pour plus d'informations, suivez les rfrences croises appropries ou consultez Crer un cluster vSphere HA , page 23.
n
Tous les htes doivent disposer d'une licence pour vSphere HA. REMARQUE Les htes ESX/ESXi 3.5 sont pris en charge par vSphere HA mais doivent inclure un correctif afin de traiter un problme impliquant le verrouillage de fichiers. Vous devez appliquer le correctif ESX350-201012401-SG pour les htes ESX 3.5, et le correctif ESXe350-201012401-I-BG pour les htes ESXi 3.5. D'autres correctifs doivent tre appliqus pralablement ces correctifs.
22
VMware, Inc.
n n
Le cluster doit contenir deux htes au minimum. Tous les htes doivent tre configurs avec des adresses IP statiques. Si vous utilisez DHCP, vrifiez que l'adresse de chaque hte est conserve aprs les redmarrages. Il doit y avoir au moins un rseau de gestion commun parmi tous les htes mais il est recommand d'en avoir au moins deux. Les rseaux de gestion diffrent selon la version de l'hte que vous utilisez.
n n n
Htes ESX - rseau de la console du service. Htes ESXi antrieurs la version 4.0 - Rseau VMkernel. Htes ESXi version 4.0 et ultrieure - Rseau VMkernel avec case [Rseau de gestion] coche.
Reportez-vous la section Meilleures pratiques pour la mise en rseau , page 33.

n
Pour vous assurer que toutes les machines virtuelles peuvent tre excutes sur n'importe quel hte du cluster, tous les htes doivent avoir accs aux mme rseaux et banques de sonnes de machines virtuelles. De mme, les machines virtuelles doivent se trouver sur des stockages partags, et non locaux, sinon il ne peut pas y avoir de basculement en cas de dfaillance de l'hte. REMARQUE vSphere HA utilise le signal de pulsation de banque de donnes pour diffrencier les htes partitionns, isols ou dfaillants. En consquence, vous devez vous assurer que les banques de donnes rserves vSphere HA sont toujours disponibles.
Le fonctionnement de surveillance des machines virtuelles ncessite l'installation des outils VMware. Reportez-vous la section Surveillance des VM et applications , page 27. La vrification du certificat de l'hte doit tre active. Reportez-vous la section Activer la vrification du certificat de l'hte , page 44. vSphere HA prend en charge IPv4 et IPv6. Un cluster utilisant la fois ces deux versions de protocole est cependant plus susceptible d'entraner une partition de rseau.
Crer un cluster vSphere HA

vSphere HA fonctionne dans le cadre d'un cluster d'htes ESXi (ou d'htes hrits ESX 3.5, 4.0 et 4.1). Vous devez crer un cluster, le remplir d'htes et configurer les paramtres vSphere HA pour que la protection du basculement puisse tre tablie. Lorsque vous crez un cluster vSphere HA, vous devez configurer divers paramtres qui dterminent le mode de fonctionnement de la fonction. Avant de commencer, identifiez les nuds du cluster. Ces nuds sont les htes ESXi qui fourniront les ressources pour la prise en charge des machines virtuelles et qui seront utiliss par vSphere HA pour la protection du basculement. Dterminez ensuite la manire dont ces nuds doivent tre relis les uns aux autres et au stockage partag o rsident les donnes de la machine virtuelle. Lorsque l'architecture de mise en rseau est en place, vous pouvez ajouter les htes au cluster et terminer la configuration de vSphere HA. Vous pouvez activer et configurer vSphere HA avant d'ajouter des nuds d'htes au cluster. Toutefois, tant que les htes n'ont pas t ajouts, le cluster n'est pas entirement oprationnel et quelques paramtres du cluster ne sont pas disponibles. Par exemple, les rgles de contrle d'admission Spcifier un hte de basculement ne sont pas disponibles tant qu'un hte n'a pas t dfini comme hte de basculement. REMARQUE La fonction de dmarrage et d'arrt de la machine virtuelle (dmarrage automatique) est dsactive pour toutes les machines virtuelles rsidant sur des htes qui se trouvent dans un cluster vSphere HA (ou qui y ont t dplaces). Le dmarrage automatique n'est pas pris en charge avec vSphere HA.
VMware, Inc.
23
Crer un cluster vSphere HA

Vous pouvez rendre votre cluster compatible avec vSphere HA. Un cluster doit obligatoirement tre compatible avec vSphere HA pour que Fault Tolerance fonctionne. VMware recommande de commencer par crer un cluster vide. Aprs avoir planifi les ressources et l'architecture de mise en rseau du cluster, vous pouvez utiliser vSphere Client pour ajouter des htes au cluster et dfinir les paramtres vSphere HA du cluster. Connectez vSphere Client vCenter Server en utilisant un compte ayant des droits d'accs administrateur au cluster. Prrequis Vrifiez que toutes les machines virtuelles et leurs fichiers de configuration rsident sur des stockages partags. Vrifiez que les htes sont configurs pour accder ce stockage partag, afin de pouvoir mettre sous tension les machines virtuelles l'aide de diffrents htes dans le cluster. Vrifiez que les htes sont configurs pour avoir accs au rseau de machines virtuelles. REMARQUE VMware recommande des connexions rseau de gestion redondantes pour vSphere HA. Pour plus d'informations sur la configuration d'un rseau redondant, consultez la rubrique Redondance des chemins de rseau , page 34. Procdure 1 2 3 Slectionnez les vues {[Htes & Clusters]}. Cliquez avec le bouton droit sur le centre de donnes dans l'arborescence d'inventaire et slectionnez [Nouveau cluster] . Compltez le paramtre de l'assistant Nouveau cluster. N'activez pas vSphere HA (ou DRS) ce moment-l. 4 Cliquez sur [Terminer] pour fermer l'assistant et crer le cluster. Vous avez cr un cluster vide. 5 6 Utilisez vSphere Client pour ajouter des htes au cluster en vous rfrant la planification des ressources et de l'architecture rseau du cluster. Cliquez avec le bouton droit sur le cluster et slectionnez [Modifier les paramtres] . La bote de dialogue Paramtres du cluster permet de modifier les paramtres de vSphere HA (et autres) pour le cluster. 7 8 Slectionnez [Dmarrer vSphere HA] sur la page Fonctions de cluster. Configurez les paramtres vSphere HA comme il convient pour le cluster.
n n n n n
tat de surveillance d'hte Contrle d'admission Options de machine virtuelle Surveillance de VM Signal de pulsation des banques de donnes
Cliquez sur [OK] pour fermer la bote de dialogue Paramtres du cluster.
Vous disposez dsormais d'un cluster vSphere HA configur et rempli d'htes.
24
VMware, Inc.
Fonctionnalits des clusters

Le premier panneau de l'assistant Nouveau cluster permet de dfinir les options de base du cluster. Ce panneau permet de nommer le cluster et de choisir une ou deux fonctions de cluster. Nom Permet de prciser le nom du cluster. Ce nom figure dans le panneau d'inventaire de vSphere Client. Vous devez saisir un nom pour continuer crer le cluster. Lorsque cette case cocher est slectionne, les machines virtuelles redmarrent sur un autre hte du cluster en cas de dysfonctionnement d'un hte. Vous devez dmarrer vSphere HA pour activer vSphere Fault Tolerance sur n'importe quelle machine virtuelle du cluster. Si cette case cocher est slectionne, DRS rpartit la charge des machines virtuelle travers le cluster. DRS place et migre galement les machines virtuelles lorsqu'elles sont protges par HA.
Dmarrer vSphere HA
Dmarrer vSphere DRS
Il est possible de modifier les fonctions des clusters par la suite.
Surveillance d'hte
Aprs avoir cr un cluster, la surveillance d'hte permet l'hte matre vSphere HA de rpondre aux dfaillances de l'hte ou de la machine virtuelle et l'isolation du rseau de gestion. Quand [Activer la surveillance de l'hte] est slectionn, chaque hte du cluster est surveill pour s'assurer de son bon fonctionnement. En cas de dfaillance d'un hte, les machines virtuelles sont redmarres sur un autre hte. La surveillance d'hte est aussi requise pour le bon fonctionnement du processus de rcupration vSphere Fault Tolerance. REMARQUE Si vous devez effectuer des oprations de maintenance rseau risquant de dclencher des ractions d'isolation des htes, VMware vous recommande d'interrompre pralablement vSphere HA en dsactivant la surveillance d'hte. Lorsque la maintenance est termine, activez nouveau la surveillance d'hte.
Activer ou dsactiver le contrle d'admission

L'assistant Nouveau cluster permet d'activer ou de dsactiver le contrle d'admission pour le cluster vSphere HA et de choisir les rgles d'application. Il est possible d'activer ou de dsactiver le contrle d'admission pour le cluster vSphere HA. Activer : Dsactive l'alimentation des machines virtuelles dans les oprations qui enfreignent les contraintes de disponibilit. Dsactiver : Active l'alimentation des machines virtuelles dans les oprations qui enfreignent les contraintes de disponibilit. Active le contrle d'admission, applique des contraintes de disponibilit et conserve la capacit de basculement. Toute opration sur une machine virtuelle qui rduit les ressources non rserves dans le cluster et qui enfreint les contraintes de disponibilit est interdite.
Dsactive le contrle d'admission Les machines virtuelles peuvent, par exemple, tre mises sous tension mme si cela aboutit une capacit de basculement insuffisante. Lorsque vous faites cela, aucun avertissement n'est prsent et le cluster ne devient pas rouge. Si un cluster a une capacit de
VMware, Inc.
25
basculement insuffisante, vSphere HA peut continuer effectuer des basculements et utilise le paramtre de priorit de redmarrage de la machine virtuelle pour prciser quelles machines virtuelles doivent tre mises sous tension les premires. vSphere HA prvoit trois rgles d'application du contrle d'admission en cas d'activation.
n n n
Pannes d'hte que le cluster tolre Pourcentage des ressources de cluster rserves en tant que capacit de basculement de secours Dfinir les htes de basculement
REMARQUE Reportez-vous la section Choisir une rgle de contrle d'admission , page 22 pour plus d'informations sur le fonctionnement du contrle d'admission vSphere HA.
Options des machines virtuelles

Les paramtres par dfaut des machines virtuelles contrlent l'ordre dans lequel celles-ci sont redmarres (priorit de redmarrage VM), ainsi que la rponse de vSphere HA lorsque des htes ne sont plus connects via le rseau aux autres htes (rponse l'isolement d'un hte). Ces paramtres s'appliquent toutes les machines virtuelles du cluster en cas de dfaillance ou d'isolement d'un hte. Vous pouvez configurer des exceptions pour des machines virtuelles spcifiques. Reportez-vous la section Personnaliser le comportement de vSphere HA pour une machine virtuelle , page 31.
Paramtre de priorit de redmarrage des machines virtuelles

La priorit de redmarrage des machines virtuelles dtermine l'ordre relatif de redmarrage des machines virtuelles en cas de dfaillance d'un hte. Les machines virtuelles sont redmarres successivement sur leurs nouveaux htes, en commenant par les machines virtuelles ayant la priorit la plus leve, puis celles ayant une priorit infrieure, jusqu' ce que toutes les machines virtuelles aient redmarr ou qu'il n'y ait plus de ressources de cluster disponibles. Si le nombre de dfaillances d'htes dpasse le seuil autoris par le contrle d'admission, les machines virtuelles ayant une priorit infrieure risquent de ne pas redmarrer tant que des ressources supplmentaires ne seront pas disponibles. Les machines virtuelles sont redmarres sur l'hte de basculement, s'il a t pralablement dfini. Les valeurs de ce paramtre sont les suivantes : Dsactiv, Basse, Moyen (par dfaut) et Haut. Si l'option Dsactiv est slectionne, vSphere HA est dsactiv pour la machine virtuelle, ce qui signifie qu'elle n'est pas redmarre sur d'autres htes ESXi en cas de dysfonctionnement de son hte. La slection de Dsactiv n'affecte pas la surveillance des machines virtuelles. Par consquent, si une machine virtuelle est dfaillante sur un hte qui fonctionne correctement, cette machine virtuelle est rinitialise sur le mme hte. Vous pouvez modifier ce paramtre pour des machines virtuelles individuelles. Les paramtres de priorit du redmarrage des machines virtuelles varient en fonction des besoins de l'utilisateur. VMware vous recommande d'associer une priorit de redmarrage leve aux machines virtuelles qui fournissent les services les plus importants. Par exemple, dans le cas d'une application multitche, vous pouvez classer les attributions en fonction des fonctions hberges sur les machines virtuelles.
n n
Haute. Serveurs de base de donnes qui fournissent des donnes aux applications. Moyenne. Serveurs d'application qui exploitent les donnes de la base de donnes et fournissent des rsultats sur des pages web. Basse. Serveurs Web qui reoivent des demandes d'utilisateurs, transmettent des requtes des serveurs d'application et transmettent les rsultats aux utilisateurs.
26
VMware, Inc.
Paramtre de rponse l'isolement d'un hte

La rponse l'isolement d'un hte dtermine les vnements survenant lorsqu'un hte d'un cluster vSphere HA perd ses connexions au rseau de gestion mais continue fonctionner. Les rponses l'isolement d'un hte exigent que l'tat de surveillance de l'hte soit activ. Si l'tat de surveillance de l'hte est dsactiv, les rponses l'isolement d'un hte sont galement suspendues. Un hte dtermine qu'il est isol lorsqu'il est incapable de communiquer avec les agents en cours d'excution sur les autres htes et d'envoyer un ping ses adresses d'isolement. Lorsque cela se produit, l'hte excute sa rponse d'isolement. Les rponses sont les suivantes : Laisser sous tension (par dfaut), Mettre hors tension et Fermer. Vous pouvez personnaliser cette proprit pour des machines virtuelles individuelles. Pour utiliser le paramtre Arrter la machine virtuelle, vous devez installer VMware Tools dans le systme d'exploitation client de la machine virtuelle. L'arrt de la machine virtuelle offre l'avantage de prserver son tat. L'arrt est prfrable la mise hors tension de la machine virtuelle qui ne prend pas en compte pas les dernires modifications apportes aux disques ni ne valide les transactions. Le basculement des machines virtuelles qui sont en train de se fermer est plus long car la fermeture doit aussi tre effectue. Les machines virtuelles qui n'ont pas t arrtes au bout de 300 secondes ou du dlai dfini par l'attribut avanc das.isolationshutdowntimeout seconds, sont mises hors tension. REMARQUE Lorsque vous avez cr un cluster vSphere HA, vous pouvez changer les paramtres par dfaut du cluster relatifs la Priorit de redmarrage et la Rponse l'isolement de machines virtuelles spcifiques. Ces remplacements sont utiles pour les machines virtuelles qui sont utilises pour des tches spciales. Par exemple, les machines virtuelles qui fournissent des services d'infrastructure, comme DNS ou DHCP, doivent ventuellement tre mises sous tension avant d'autres machines virtuelles du cluster. Si la rponse l'isolement d'un hte est dsactive (autrement dit, s'il laisse les machines virtuelles sous tension lorsqu'il est isol) et si l'hte n'a plus accs au rseau de gestion et au rseau de stockage, une situation de division peut survenir. Dans ce cas, l'hte isol perd le verrouillage des disques et les machines virtuelles sont bascules vers un autre hte, mme si les instances d'origine des machines virtuelles continuent de s'excuter sur l'hte isol. Lorsque l'hte sortira de son isolement, il y aura deux copies des machines virtuelles, bien que la copie prsente sur l'hte initialement isol n'ait pas accs aux fichiers vmdk et que la corruption des donnes soit empche. Dans vSphere Client, les machines virtuelles semblent faire des allers et retours entre les deux htes. Pour rsoudre ce problme, ESXi gnre une question sur la machine virtuelle qui a perdu les verrouillages disque pour le moment o l'hte quittera son tat isol et ralise qu'il ne peut pas obtenir de nouveau les verrouillages disque. vSphere HArpond automatiquement cette question ce qui permet l'instance de la machine virtuelle qui a perdu les verrouillages disque de s'arrter, laissant uniquement l'instance qui dispose des verrouillages disque.
Surveillance des VM et applications

Surveillance de VM redmarre les machines virtuelles si leurs signaux de pulsation de VMware Tools n'ont pas t reus pendant un certain temps. De mme, la Surveillance d'application peut redmarrer une machine virtuelle si les signaux de pulsation d'une application excute ne sont pas reus. Il est possible d'activer ces fonctions et de configurer la sensibilit de la surveillance de l'absence de raction par vSphere HA. Lorsque vous activez la Surveillance de VM, le service Surveillance de VM ( l'aide de VMware Tools) vrifie si chaque machine virtuelle du cluster fonctionne en vrifiant la rgularit des signaux de pulsations et l'activit des E/S partir du processus VMware Tools excut sur le client. Si aucun signal de pulsation ou activit des E/S n'est reu, cela est probablement d une dfaillance du systme d'exploitation client ou au fait que les VMware Tools n'ont pas eu le temps de terminer certaines tches. Dans ce cas, le service Surveillance de VM dtermine que la machine virtuelle est dfectueuse et la machine virtuelle redmarre pour restaurer le service.
VMware, Inc.
27
Il arrive qu'occasionnellement, les machines virtuelles ou les applications qui continuent fonctionner correctement, cessent d'mettre des signaux de pulsation. Pour viter les rinitialisations inutiles, le service Surveillance de VM surveille aussi l'activit des E/S d'une machine virtuelle. Si aucun signal de pulsation n'est reu pendant la priode de dfaillance, la frquence des statistiques des E/S (attribut dfini au niveau du cluster) est vrifie. La frquence des statistiques des E/S dtermine si un disque ou une activit rseau s'est produite sur la machine virtuelle au cours des deux minutes (120 secondes) prcdentes. Si ce n'est pas le cas, la machine virtuelle est rinitialise. Cette valeur par dfaut (120 secondes) peut tre modifie l'aide de l'attribut avanc das.iostatsinterval. Pour activer la surveillance d'application, il faut d'abord obtenir le SDK appropri (ou utiliser une application qui prend en charge la surveillance de l'application VMware) et l'utiliser pour configurer des signaux de pulsation personnaliss pour les applications surveiller. Aprs avoir fait cela, la surveillance d'application fonctionne de la mme manire que la Surveillance de VM. Si les signaux de pulsation d'une application ne sont pas reus pendant un certain temps, sa machine virtuelle est redmarre. Vous pouvez configurer le niveau de sensibilit de la surveillance. Une sensibilit de surveillance leve permet de conclure plus rapidement un dysfonctionnement. Mme si cela est peu probable, une sensibilit de surveillance leve peut entraner l'identification errone de dysfonctionnements alors que la machine virtuelle ou l'application en question fonctionne toujours mais les signaux de pulsation ne sont pas reus du fait de certains facteurs tels que des contraintes de ressources. Une sensibilit de surveillance basse se traduit par des interruptions de service prolonges entre les dfaillances avres et le redmarrage des machines virtuelles. Slectionnez l'option qui offre un compromis intressant par rapport vos besoins. Les paramtres par dfaut de la sensibilit de surveillance sont dcrits dans Tableau 2-1. Vous pouvez aussi indiquer des valeurs personnalises la fois pour la sensibilit de la surveillance et les intervalles de statistiques d'E/S en cochant la case [Personnalis] . Tableau 2-1. Paramtres de surveillance des machines virtuelles
Paramtre Haut Moyen Faible Intervalle de dfaillance (en secondes) 30 60 120 Priode de rinitialisation 1 heure 24 heures 7 jours
Lorsque des dysfonctionnements sont dtects, vSphere HA rinitialise les machines virtuelles. La rinitialisation contribue garantir que les services restent disponibles. Pour viter de rinitialiser constamment des machines virtuelles en cas d'erreurs non transitoires, les machines virtuelles sont rinitialises par dfaut trois fois seulement au cours d'une priode configurable. Aprs trois rinitialisations des machines virtuelles, vSphere HA n'effectue aucune tentative supplmentaire pour redmarrer les machines virtuelles en cas de nouvel chec et ce jusqu' ce que la priode dfinie ne soit coule. Vous pouvez configurer le nombre de rinitialisations l'aide du paramtre personnalis [Nbre maximum de rinitialisations par machine virtuelle] .
Personnaliser le comportement de vSphere HA

Aprs avoir cr un cluster, vous pouvez modifier les attributs spcifiques qui affectent le comportement de vSphere HA. Vous pouvez galement modifier les paramtres par dfaut du cluster hrits par des machines virtuelles individuelles. Vrifiez les paramtres avancs que vous pouvez utiliser pour optimiser les clusters vSphere HA dans votre environnement. Ces attributs affectent le fonctionnement de vSphere HA. Modifiez-les donc avec prudence.
28
VMware, Inc.
Dfinir les options avances de vSphere HA

Pour personnaliser le comportement de vSphere HA, dfinissez les options avances de vSphere HA. Prrequis Cluster vSphere HA dont il faut modifier les paramtres. Privilges de l'administrateur du cluster. Procdure 1 2 3 4 Slectionnez [vSphere HA] dans la bote de dialogue Paramtres du cluster. Cliquez sur le bouton [Options avances] pour ouvrir la bote de dialogue Options avances (HA). Saisissez chacun des attributs avancs modifier dans une zone de texte de la colonne [Option] et saisissez une valeur dans la colonne [Valeur] . Cliquez sur [OK] .
Le cluster utilise des options que vous avez ajoutes ou modifies.
Attributs avancs de vSphere HA

Vous pouvez dfinir des attributs avancs qui affectent le comportement du cluster vSphere HA. Tableau 2-2. Attributs avancs de vSphere HA
Attribut das.isolationaddress[...] Description dfinit l'adresse pour excuter un ping afin de dterminer si un hte est isol du rseau. Le ping est uniquement envoy cette adresse lorsqu'aucun autre hte du cluster ne reoit de signaux de pulsation. En l'absence de prcision, la passerelle par dfaut du rseau de gestion est utilise. Cette passerelle par dfaut doit tre une adresse fiable et disponible, de sorte que l'hte puisse dterminer s'il est isol du rseau. Vous pouvez indiquer plusieurs adresses d'isolement (jusqu' 10) pour le cluster : das.isolationaddressX, o X = 1-10. Vous devez gnralement en indiquer une par rseau de gestion. L'indication d'un nombre excessif d'adresses ralentit la dtection de l'isolement. Par dfaut, vSphere HA utilise la passerelle par dfaut du rseau de console comme adresse d'isolement. Cet attribut indique l'utilisation ou non de ce paramtre par dfaut (vrai| faux). Priode pendant laquelle le systme attend que la machine virtuelle s'arrte avant de la mettre hors tension. Cela s'applique uniquement si la rponse l'isolement de l'hte est Arrter la machine virtuelle. La valeur par dfaut est de 300 secondes. Dfinit la limite maximum de la taille d'un slot de mmoire. Si cette option est utilise, la taille du slot est la plus petite de cette valeur ou la rserve de mmoire maximale plus la capacit supplmentaire de n'importe quelle machine virtuelle sous tension dans le cluster. Dfinit la limite maximale de la taille d'un slot de CPU. Si cette option est utilise, la taille du slot est la plus petite de cette valeur ou la rserve de CPU maximale de n'importe quelle machine virtuelle sous tension dans le cluster.
das.usedefaultisolationaddress
das.isolationshutdowntimeout
das.slotmeminmb
das.slotcpuinmhz
VMware, Inc.
29
Tableau 2-2. Attributs avancs de vSphere HA (suite)

Attribut das.vmmemoryminmb Description Dfinit la valeur de ressources de mmoire par dfaut associe une machine virtuelle si sa rserve de mmoire n'est pas prcise ou nulle. Celle-ci est utilise pour les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster. Si aucune valeur n'est spcifie, la valeur par dfaut est de 0 Mo. Dfinit la valeur des ressources CPU par dfaut associe une machine virtuelle si sa rserve de CPU n'est pas prcise ou nulle. Celle-ci est utilise pour les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster. Si aucune valeur n'est spcifie, la valeur par dfaut est de 32 MHz. Modifie l'intervalle de statistique des E/S par dfaut pour la sensibilit de surveillance des machines virtuelles. La valeur par dfaut est de 120 (secondes). Peut tre dfinie sur une valeur suprieure ou gale 0. Une valeur nulle dsactive la vrification. Dsactive les problmes de configuration crs si l'hte n'a pas suffisamment de banques de donnes signal de pulsation pour vSphere HA. La valeur par dfaut est "faux". Modifie le nombre de banques de donnes signal de pulsation ncessaire. Les valeurs peuvent s'tendre de 2 5 et la valeur par dfaut est 2.
das.vmcpuminmhz
das.iostatsinterval
das.ignoreinsufficienthbdatastore
das.heartbeatdsperhost
REMARQUE Si vous modifiez la valeur de l'un des attributs avancs suivants, vous devez dsactiver, puis ractiver vSphere HA avant que les modifications ne s'appliquent.
n n n
das.isolationaddress[...] das.usedefaultisolationaddress das.isolationshutdowntimeout
Options qui ne sont plus prises en charge

Dans vCenter Server 5.0, un certain nombre d'options de configuration avance pour vSphere HA ne sont plus prises en charge. Les options suivantes ne sont plus prises en charge.
n n n n n n n n n n n n
das.consoleUser das.consoleNode das.consolePerm das.primaryCount das.checkVmStateDelay das.trace das.traceLevel das.traceOutput das.preferredPrimaries das.disableUWSwapRequirement das.sensorPollingFreq das.bypassNetCompatCheck
30
VMware, Inc.
n n n
das.defaultfailoverhost das.failureDetectionTime das.failureDetectionInterval
Si vous tentez de dfinir une des options non prises en charge, vCenter Server 5.0 signale que l'option n'est pas valide. De mme, si vous effectuez une mise niveau de vCenter Server 5.0 partir d'une version prcdente avec une de ces options dfinies, elles sont supprimes et ne sont plus utilisables.
Personnaliser le comportement de vSphere HA pour une machine virtuelle

Les paramtres par dfaut du cluster relatifs la priorit de redmarrage, la rponse d'isolation de l'hte et la surveillance des machines virtuelles sont associs chaque machine virtuelle d'un cluster vSphere HA. Vous pouvez prciser des comportements spcifiques pour chaque machine virtuelle en changeant ces valeurs par dfaut. Si la machine virtuelle quitte le cluster, ces paramtres sont perdus. Procdure 1 2 3 4 5 6 Slectionnez le cluster et choisissez [Modifier les paramtres] dans le menu contextuel. Slectionnez [Options de machine virtuelle] sous vSphere HA. Slectionnez une machine virtuelle dans le panneau Paramtres de la machine virtuelle et personnalisez son paramtre [Priorit redmarrage VM] ou [Rponse isolation hte] . Slectionnez [Surveillance de VM] sous vSphere HA. Slectionnez une machine virtuelle dans le panneau Paramtres de la machine virtuelle et personnalisez son paramtre [Surveillance de VM] . Cliquez sur [OK] .
Le comportement de la machine virtuelle est dsormais diffrent des rglages par dfaut du cluster pour chaque paramtre modifi.
Meilleures pratiques pour les clusters vSphere HA

Pour garantir des performances optimales des clusters vSphere HA, VMware recommande de respecter certaines meilleures pratiques. La configuration du rseau et la redondance sont des critres importants lors de la conception et de l'implmentation du cluster.
Dfinir des alarmes pour surveiller les changements des clusters

Quand vSphere HA ou Fault Tolerance interviennent pour prserver la disponibilit en effectuant un basculement de machine virtuelle, par exemple, vous avez la possibilit d'tre averti de ces changements. Dans vCenter Server, configurez des alarmes qui seront dclenches lorsque ces actions surviendront, et recevez des alertes, sous forme de messages lectroniques, par exemple, envoyes un groupe d'administrateurs prdfini. Plusieurs alarmes par dfaut sont disponibles pour vSphere HA.
n n n n n n
Ressources de basculement insuffisantes (alarme de cluster) Impossible de trouver le cluster principal (une alarme de cluster) Basculement en cours (une alarme de cluster) Statut HA de l'hte (une alarme d'hte) Erreur de surveillance VM (une alarme de machine virtuelle) Action de surveillance de VM (alarme de machine virtuelle)
VMware, Inc.
31
chec du basculement (alarme de machine virtuelle)
REMARQUE Les alarmes par dfaut contiennent le nom de la fonction, vSphere HA.
Surveillance de la validit du cluster

Un cluster valide est un cluster sur lequel il n'y eu aucune violation des rgles de contrle d'admission. Un cluster activ pour vSphere HA devient non valide (rouge) lorsque le nombre de machines virtuelles sous tension dpasse les conditions de basculement, c'est--dire que la capacit de basculement actuelle est infrieure la capacit de basculement configure. Si le contrle d'admission est dsactiv, les clusters ne deviennent pas non valides. L'onglet [Rsum] du cluster dans vSphere Client prsente la liste des problmes de configuration des clusters. La liste dtaille les causes de la non validit d'un cluster ou de son affectation excessive (jaune). Le comportement DRS n'est pas affect par un cluster rouge cause d'un problme li vSphere HA.
Vrifier l'tat oprationnel du cluster

Un cluster ou ses htes peuvent connatre des problmes de configuration et d'autres erreurs qui nuisent au bon fonctionnement de vSphere HA. Vous pouvez surveiller ces erreurs sur l'cran tat oprationnel du cluster qui est accessible dans vSphere Client, la rubrique vSphere HA de l'onglet [Rsum] du cluster. Rsoudre les problmes rpertoris. Pour la plupart des problmes de configuration, un vnement correspondant est consign. Tous les vnements vSphere HA contiennent vSphere HA dans leur description. Vous pouvez chercher ce terme pour trouver les vnements correspondants.
Interoprabilit de vSphere HA et Storage vMotion dans un cluster mixte

Dans les clusters o des htes ESXi 5.0 et ESX / ESXi 4.1 ou des htes antrieurs sont prsents et o Storage vMotion est largement utilis ou Storage DRS est activ, VMware vous recommande de ne pas dployer vSphere HA. vSphere HA pourrait rpondre une dfaillance de l'hte en redmarrant une machine virtuelle sur un hte avec une version ESXi diffrente de celle sur laquelle la machine virtuelle a t lance avant l'chec. Un problme peut survenir si, au moment de la dfaillance, la machine virtuelle participait une action de Storage vMotion sur un hte ESXi 5.0, et si vSphere HA redmarre la machine virtuelle sur un hte ayant une version antrieure ESXi 5.0. Pendant l'allumage de la machine virtuelle, des tentatives ultrieures d'oprations de snapshot pourraient corrompre l'tat du vdisk et rendre la machine virtuelle inutilisable.
Meilleures pratiques pour le contrle d'admission

Les recommandations suivantes constituent les meilleures pratiques pour le contrle d'admission vSphere HA.
n
Slectionnez les rgles de contrle d'admission Pourcentage de ressources de cluster rserves. Ces rgles offrent la plus grande flexibilit en termes de dimensionnement d'htes et de machines virtuelles. Dans la plupart des cas, le calcul 1/N, o N est le nombre total de nuds dans le cluster, dtermine la quantit qui convient. Assurez-vous d'attribuer la mme taille tous les htes du cluster. Si un cluster est dsquilibr, une capacit excessive est rserve au traitement des dfaillances du plus grand nud possible. Faites en sorte que les spcifications de dimensionnement des machines virtuelles soient similaires parmi toutes les machines virtuelles configures. Les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster utilisent la taille de slot pour calculer la capacit qui doit tre rserve chaque machine virtuelle. La taille de slot repose sur la plus grande mmoire et CPU rserves ncessaires une machine virtuelle. Lorsque vous mlangez des machines virtuelles ayant des spcifications de CPU et de mmoire diffrentes, le calcul dtermine la plus grande taille de slot possible, ce qui limite la consolidation.
32
VMware, Inc.
Utiliser Auto Deploy avec vSphere HA

Vous pouvez utiliser simultanment vSphere HA et Auto Deploy pour amliorer la disponibilit de vos machines virtuelles. Auto Deploy approvisionne les htes lorsqu'ils s'allument. Vous pouvez galement le configurer pour installer l'agent vSphere HA sur ces htes pendant le processus de dmarrage. Pour qu'Auto Deploy installe l'agent vSphere HA, le profil d'image que vous attribuez l'hte doit contenir le VIB vmwarefdm. Pour plus de dtails, consultez la documentation d'Auto Deploy incluse dans le guide Installation et configuration de vSphere.
Interruption de vSphere HA
Si vous devez effectuer des oprations de maintenance rseau risquant de dclencher des ractions d'isolation des htes, VMware vous recommande d'interrompre pralablement vSphere HA en dsactivant la surveillance d'hte. Lorsque la maintenance est termine, activez nouveau la surveillance d'hte.
Meilleures pratiques pour la mise en rseau

VMware recommande de suivre des meilleures pratiques pour la configuration des adaptateurs rseau htes et la topologie du rseau pour vSphere HA. Les meilleures pratiques incluent des recommandations pour vos htes ESXi, et traitent aussi du cblage, des commutateurs, des routeurs et des pare-feu.
Configuration et maintenance du rseau

Les suggestions de maintenance du rseau suivantes contribuent viter une dtection accidentelle d'htes dfectueux et une isolation du rseau dues la perte des signaux de pulsation vSphere HA.
n
En cas de modification des rseaux sur lesquels se trouvent les htes ESXi en clusters, VMware recommande de suspendre la fonction de surveillance d'hte. Les changements de matriel ou de paramtres rseau peuvent interrompre les signaux de pulsation utiliss par vSphere HA pour dtecter les dfaillances d'htes, ce qui risque d'entraner des tentatives intempestives de basculement des machines virtuelles. Lorsque vous modifiez la configuration rseau directement sur les htes ESXi, par exemple, pour ajouter des groupes de ports ou pour supprimer des vSwitches, VMware recommande non seulement de suspendre la surveillance de ces htes mais galement de les placer en mode maintenance. Lorsque l'hte quitte le mode maintenance, il est reconfigur, ce qui provoque un nouvel examen des informations rseau de l'hte en cours d'excution. S'il n'a pas t plac en mode maintenance, l'agent vSphere HA s'excute en utilisant les anciennes informations de configuration rseau.
REMARQUE La mise en rseau tant un aspect essentiel de vSphere HA, l'administrateur de vSphere HA doit tre tenu inform de toute opration de maintenance du rseau.
Rseaux utiliss pour les communications vSphere HA

Pour identifier les oprations rseau qui risquent de perturber le bon fonctionnement de vSphere HA, il est ncessaire d'identifier les rseaux de gestion utiliss pour les signaux de pulsation et autres communications vSphere HA.
n
Sur les htes hrits ESX du cluster, les communications vSphere HA sont achemines via tous les rseaux qui sont identifis comme rseaux de console de service. Les rseaux VMkernel ne sont pas utiliss par ces htes pour les communications vSphere HA.
VMware, Inc.
33
Sur les htes ESXi du cluster, les communications vSphere HA sont achemines par dfaut via les rseaux VMkernel, sauf ceux spcifiques vMotion. S'il n'existe qu'un seul rseau VMkernel, vSphere HA le partage avec vMotion, si ncessaire. Avec ESXi 4.x et ESXi, il faut aussi cocher explicitement la case [Trafic de gestion] si vSphere HA doit utiliser ce rseau.
REMARQUE Pour maintenir le trafic de gestion de lagent vSphere HA spar de tout autre trafic rseau, VMware vous recommande de configurer les htes de faon ce que les cartes vmkNIC utilises par vSphere HA ne partagent pas les sous-rseaux avec les cartes vmkNIC utilises dautres fins. Les agents vSphere HA envoient des paquets en utilisant une carte pNIC associe un sous-rseau donn sil y a aussi au moins une carte vmkNIC configure pour le trafic de gestion vSphere HA. Par consquent, pour assurer la sparation de flux rseau, les cartes vmkNIC utiliss par vSphere HA et par les autres fonctionnalits doivent tre sur des sousrseaux diffrents.
Adresses d'isolation rseau

Une adresse d'isolation rseau est une adresse IP qui reoit une commande ping pour dterminer si un hte est isol du rseau. Le ping est uniquement envoy cette adresse lorsqu'un hte a cess de recevoir les signaux de pulsation de tous les autres htes du cluster. Si un hte peut envoyer un ping son adresse d'isolation rseau, l'hte n'est pas rseau isol et les autres htes du cluster ont chou. Mais si l'hte ne peut pas envoyer de ping son adresse d'isolation, il est probable que l'hte ait t isol du rseau et aucune action de basculement n'est entreprise. L'adresse d'isolation rseau est la passerelle par dfaut de l'hte. Une seule passerelle est dfinie par dfaut, quel que soit le nombre de rseaux de gestion dfinis. Vous devez utiliser l'attribut avanc das.isolationaddress[...] pour ajouter des adresses d'isolation des rseaux supplmentaires. Reportez-vous Attributs avancs de vSphere HA , page 29.
Autres considrations sur la mise en rseau

Vous devez prendre en considration d'autres lments lors de la configuration de la mise en rseau prenant en charge votre cluster vSphere HA.
n
Configuration des commutateurs. Si les commutateurs rseau physiques qui relient les serveurs prennent en charge le paramtre PortFast (ou quivalent), activez-le. Ce paramtre empche un hte de se tromper en dterminant qu'un rseau est isol au cours de l'excution de longs algorithmes STA. Noms de groupes de ports et tiquettes rseau. Utilisez des noms de groupes de ports cohrents et des tiquettes rseau sur les VLAN des rseaux publics. Les noms de groupes de ports permettent de reconfigurer l'accs au rseau par les machines virtuelles. Si vous utilisez des noms incohrents entre le serveur d'origine et le serveur de basculement, les machines virtuelles sont dconnectes de leur rseau aprs le basculement. Les tiquettes rseau sont utilises par les machines virtuelles pour rtablir la connectivit rseau au redmarrage. Configurez les rseaux de gestion de sorte que l'agent vSphere HA prsent sur un hte du cluster puisse associer les agents de n'importe quel autre hte via l'un des rseaux de gestion. Si votre configuration ne respecte pas cela, une partition de rseau peut survenir aprs le choix d'un hte principal.
Redondance des chemins de rseau

La redondance des chemins de rseau entre les nuds de cluster est importante pour la fiabilit de vSphere HA. Un rseau de gestion isol finit par tre un point de panne isol, ce qui aboutit des basculements mme si le rseau uniquement est dfectueux. S'il n'y a qu'un seul rseau de gestion, toute dfaillance entre l'hte et le cluster peut provoquer une activit de basculement inutile (ou errone). Les dfaillances possibles incluent les pannes de adaptateurs rseau, les pannes de cbles rseau, la suppression de cbles rseau et les rinitialisations de commutateurs. Examinez ces causes possibles de dfaillances entre les htes et efforcez-vous de les minimiser en assurant une redondance du rseau.
34
VMware, Inc.
Il est possible d'implmenter la redondance du rseau au niveau de l'association de adaptateurs rseau, ou au niveau rseau de gestion. Dans la plupart des implmentations, l'association des adaptateurs rseau offre une redondance suffisante, mais il est possible d'utiliser ou d'ajouter au besoin la redondance de rseau de gestion. La mise en rseau de gestion redondante garantit la fiabilit de la dtection des pannes et vite la ralisation de conditions d'isolation car les signaux de pulsation peuvent tre transmis via plusieurs rseaux. Configurez un nombre aussi rduit que possible de segments matriels entre les serveurs d'un cluster. L'objectif est de limiter les points de panne isols. De plus, les chemins contenant trop de bonds peuvent provoquer des retards de paquets de signaux de pulsation et augmenter les points de panne ventuels.
Redondance par association de adaptateurs rseau

L'utilisation d'une association de deux adaptateurs rseau connectes pour sparer les commutateurs physiques amliore la fiabilit d'un rseau de gestion. Le cluster est plus rsilient car les serveurs connects par deux adaptateurs rseau (et par des commutateurs spars) ont deux chemins indpendants pour la transmission et la rception de signaux de pulsation. Pour configurer une association de adaptateurs rseau pour rseau de gestion, configurez les vNIC de la configuration vSwitch pour la configuration Active ou Standby. Les rglages recommands pour les paramtres des vNIC sont les suivants :
n n
quilibrage de charge par dfaut = Router en fonction de l'ID du port d'origine Retour arrire = Non
Lorsque vous avez ajout une carte rseau un hte de votre cluster vSphere HA, vous devez reconfigurer vSphere HA sur cet hte.
Redondance rseau utilisant un rseau secondaire

Au lieu d'associer des adaptateurs rseau pour assurer la redondance des signaux de pulsation, vous pouvez crer une connexion de rseau de gestion secondaire qui est lie un commutateur virtuel distinct. La connexion de rseau de gestion principale est utilise pour le rseau et des fins de gestion. Lorsque la connexion de rseau de gestion secondaire est cre, vSphere HA transmet des signaux de pulsation la fois via les connexions de rseau de gestion principales et secondaires. Si un chemin est dfaillant, vSphere HA peut continuer transmettre et recevoir des signaux de pulsation par l'autre chemin.
VMware, Inc.
35
36
VMware, Inc.
Assurer Fault Tolerance des machines virtuelles
Il est possible d'activer vSphere Fault Tolerance pour les machines virtuelles afin d'assurer la continuit d'activit avec des niveaux de disponibilit et de protection des donnes suprieurs ceux offerts par vSphere HA. Fault Tolerance est intgre la plate-forme hte ESXi (par la technologie VMware vLockstep) et elle assure la continuit de la disponibilit en excutant des machines virtuelles identiques en mode rigide virtuel sur des htes distincts. Pour obtenir des rsultats optimaux de Fault Tolerance, il est ncessaire d'en comprendre le fonctionnement, de savoir comment l'activer sur un cluster et sur des machines virtuelles, et de connatre les meilleures pratiques pour son utilisation. REMARQUE Vous verrez parfois apparatre des messages d'erreur quand vous tenterez d'utiliser Fault Tolerance. Pour plus d'informations sur les messages d'erreur lis Fault Tolerance, consultez l'article de la base de connaissances VMware sur http://kb.vmware.com/kb/1033634. Ce chapitre aborde les rubriques suivantes :
n n n n n n n n n n
Fonctionnement de Fault Tolerance , page 38 Utiliser Fault Tolerance avec DRS , page 39 Cas d'utilisation de Fault Tolerance , page 39 Liste de vrification de Fault Tolerance , page 40 Interoprabilit de Fault Tolerance , page 42 Prparer votre cluster et vos htes Fault Tolerance , page 43 Assurer Fault Tolerance des machines virtuelles , page 47 Afficher des informations sur les machines virtuelles tolrantes aux pannes , page 49 Pratiques d'excellence pour Fault Tolerance , page 51 Recommandations de configuration de vSphere Fault Tolerance , page 53
VMware, Inc.
37
Fonctionnement de Fault Tolerance

vSphere Fault Tolerance assure la disponibilit continue des machines virtuelles en crant et maintenant une VM secondaire identique la VM primaire et disponible en permanence pour la remplacer en cas de situation de basculement. Il est possible d'activer Fault Tolerance sur la plupart des machines virtuelles cruciales pour une mission. Une copie de la machine virtuelle, que l'on appelle machine virtuelle secondaire, est cre et excute en mode rigide virtuel avec la machine virtuelle principale. VMware vLockstep capture les entres et les vnements qui se produisent sur la machine virtuelle principale et les transmet la machine virtuelle secondaire qui est excute sur un autre hte. partir de ces informations, l'excution de la machine virtuelle secondaire est identique celle de la machine virtuelle principale. Comme la machine virtuelle secondaire est en mode rigide virtuel avec la machine virtuelle principale, elle peut reprendre l'excution tout moment sans interruption, assurant ainsi une protection tolrante aux pannes. REMARQUE Le trafic de la journalisation de la tolrance aux pannes entre les machines virtuelles primaires et secondaires est chiffr et contient un rseau client et des donnes E/S de stockage, ainsi que le contenu de la mmoire du systme d'exploitation client. Ce trafic peut inclure des donnes sensibles telles que des mots de passe en texte brut. Pour viter que ces donnes ne soient divulgues, assurez-vous que ce rseau est scuris, notamment pour viter les attaques de l'intercepteur . Par exemple, vous pourriez utiliser un rseau priv pour le trafic de la journalisation de la tolrance aux pannes. Figure 3-1. Machine virtuelle principale et machine virtuelle secondaire dans une paire avec Fault Tolerance
primaire
applications
systme d'exploitation client systme
secondaire
applications
systme d'exploitation client systme
journalisation du trafic
VMware
VMware
client ENREGISTREMENT
vnements non dterministes Entre (rseau, utilisateur), E/S asynchrone (disque, priphriques) temporisateur CPU vnements
RPTITION
vnements non dterministes Rsultat = reproductible excution de la machine virtuelle
Les machines virtuelles principale et secondaire changent des signaux de pulsation en continu. Cet change permet la paire de machines virtuelles de contrler mutuellement leur tat pour assurer le maintien permanent de Fault Tolerance. Un basculement transparent se produit en cas de dfaillance de l'hte sur lequel la machine virtuelle principale est excute. Dans ce cas, la machine virtuelle secondaire est immdiatement active pour remplacer la machine virtuelle principale. Une nouvelle machine virtuelle secondaire dmarre et la redondance de Fault Tolerance est rtablie en quelques secondes. Si l'hte de la machine virtuelle secondaire devient dfectueux, il est aussi immdiatement remplac. Dans l'un ou l'autre cas, les utilisateurs ne constatent aucune interruption de service ni perte de donnes. Une machine virtuelle tolrante aux pannes et sa copie secondaire ne sont pas autorises fonctionner sur le mme hte. Cette restriction garantit qu'une dfaillance de l'hte ne peut pas entraner la perte des deux machines virtuelles. Vous pouvez aussi utiliser les rgles d'affinit entre machine virtuelle et hte pour prciser les htes sur lesquels certaines machines virtuelles peuvent tre excutes. Si vous utilisez ces rgles, souvenezvous que pour chaque machine virtuelle principale affecte par une rgle prcise, la machine virtuelle secondaire qui y est associe est aussi affecte par la mme rgle. Pour plus d'informations sur les rgles d'affinit, reportez-vous la documentation Gestion des ressources vSphere.
38
VMware, Inc.
Chapitre 3 Assurer Fault Tolerance des machines virtuelles
Fault Tolerance vite les situations de division qui peuvent se traduire par deux copies actives d'une machine virtuelle aprs la reprise suite un dysfonctionnement. Le verrouillage atomique des fichiers sur les stockages partags est utilis pour coordonner le basculement de faon ce qu'un ct seulement continue excuter la machine virtuelle principale et une nouvelle machine virtuelle secondaire est automatiquement raffecte. REMARQUE Le contrle anti-affinit est effectu la mise sous tension de la machine virtuelle principale. Les machines virtuelles principales et secondaires peuvent tre sur les mme htes lorsqu'elles sont toutes deux hors tension. C'est un comportement normal. Quand la machine virtuelle principale s'allume, la machine virtuelle secondaire est dmarre sur un hte diffrent.
Utiliser Fault Tolerance avec DRS

Vous pouvez utiliser vSphere Fault Tolerance avec vSphere Distributed Resource Scheduler (DRS) quand la fonction Compatibilit amliore de vMotion (EVC) est active. Ce processus permet aux machines virtuelles tolrantes aux pannes de bnficier d'un meilleur placement initial et d'tre incluses dans les calculs d'quilibrage de charge du cluster. Quand EVC est activ pour un cluster, DRS met les recommandations de placement initiales pour les machines virtuelles tolrantes aux pannes, les dplace pendant le rquilibrage de la charge du cluster et vous autorise attribuer un niveau d'automatisation DRS aux machines virtuelles principales (la machine virtuelle secondaire adopte toujours le mme paramtre que la machine virtuelle principale associe). DRS ne place pas plus d'un nombre prdfini de machines virtuelles principales ou secondaires sur un hte au cours du placement initial ou de l'quilibrage de la charge. Cette limite est contrle par l'option avance das.maxftvmsperhost. La valeur par dfaut de cette option est de 4. Mais si vous choisissez une valeur nulle, DRS ignore cette restriction. Quand vSphere Fault Tolerance est utilis pour les machines virtuelles d'un cluster pour lequel EVC est dsactiv, les machines virtuelles tolrantes aux pannes reoivent des niveaux d'automatisation DRS "dsactivs". Dans ce type de cluster, chaque machine virtuelle principale est uniquement mise sous tension sur son hte enregistr, sa machine virtuelle secondaire est place automatiquement et aucune des machines virtuelles tolrantes aux pannes n'est dplace pour l'quilibrage de charge. Si vous utilisez des rgles d'affinit avec deux machines virtuelles tolrantes aux pannes, une rgle d'affinit VM-VM s'applique uniquement la machine virtuelle principale, tandis qu'une rgle d'affinit machine virtuelle-hte s'applique la fois la machine virtuelle principale et sa machine virtuelle secondaire. Si une rgle d'affinit VM-VM est dfinie pour une machine virtuelle principale, DRS tente de corriger toutes les violations survenant aprs un basculement (c'est--dire, aprs le dplacement effectif de la machine virtuelle principale vers un nouvel hte).
Cas d'utilisation de Fault Tolerance

Plusieurs situations types peuvent bnficier de l'utilisation de vSphere Fault Tolerance. Fault Tolerance assure un meilleur niveau de continuit d'activit que vSphere HA. Lorsqu'une machine virtuelle secondaire doit intervenir pour remplacer son homologue, la machine virtuelle principale, la machine virtuelle secondaire joue immdiatement le rle de machine virtuelle principale, l'tat de la machine virtuelle restant entirement prserv. Les applications sont dj en cours d'excution et les donnes conserves en mmoire ne doivent pas tre ressaisies ou recharges. Ce n'est pas le cas du basculement assur par vSphere HA qui redmarre les machines virtuelles affectes par un dysfonctionnement. Ce haut niveau de continuit et la meilleure protection des informations d'tats et des donnes informe les scnarios du dploiement possible de Fault Tolerance.
n
Les applications qui doivent tre disponibles en permanence, surtout celles prsentant des connexions longues dures de clients que les utilisateurs veulent conserver pendant la dfaillance matrielle. Applications personnalises qui n'ont pas d'autres moyens de former un cluster.
VMware, Inc.
39
Cas o la grande disponibilit peut tre assure par des solutions de formation de cluster personnalises qui sont trs compliques configurer et entretenir.
Fault Tolerance la demande

Un autre cas pratique de protection d'une machine virtuelle par Fault Tolerance s'intitule Fault Tolerance la demande. Dans ce cas, une machine virtuelle est correctement protge par vSphere HA pendant son fonctionnement normal. Pendant certaines priodes critiques, vous voudrez renforcer la protection de la machine virtuelle. Pendant la production d'un rapport trimestriel, par exemple, dont l'interruption pourrait retarder la mise disposition d'informations cruciales pour une mission. vSphere Fault Tolerance permet de protger cette machine virtuelle avant la production du rapport, puis d'arrter ou de dsactiver Fault Tolerance aprs la publication du rapport. Vous pouvez utiliser Fault Tolerance la demande pour protger la machine virtuelle pendant une priode critique et revenir aux ressources normales pour les oprations non critiques.
Liste de vrification de Fault Tolerance

La liste de vrification suivante contient les spcifications en matire de cluster, d'hte et de machine virtuelle que vous devez connatre avant d'utiliser vSphere Fault Tolerance. Consultez cette liste avant de configurer Fault Tolerance. Vous pouvez galement utiliser l'utilitaire VMware SiteSurvey (tlchargeable sur http://www.vmware.com/download/shared_utilities.html) pour mieux comprendre les problmes de configuration associs au cluster, l'hte et aux machines virtuelles utiliss pour vSphere FT. REMARQUE Le basculement des machines virtuelles tolrantes aux pannes ne dpend pas de vCenter Server, mais vous devez utiliser vCenter Server pour configurer vos clusters de Fault Tolerance.
Spcifications des clusters pour Fault Tolerance

Les exigences suivantes aux clusters doivent tre remplies avant d'utiliser Fault Tolerance.
n
Vrification du certificat de l'hte active. Reportez-vous la section Activer la vrification du certificat de l'hte , page 44. Deux htes certifis FT au minimum utilisant la mme version de Fault Tolerance ou le mme numro de compilation d'hte. Le numro de version de Fault Tolerance apparat sur l'onglet [Rsum] d'un hte dans le vSphere Client. REMARQUE Pour les htes hrits antrieurs ESX/ESXi 4.1, cet onglet numre les numros de version des htes. Les correctifs peuvent provoquer une variation des numros de compilation d'hte entre les installations ESX et ESXi. Pour vous assurer que vos htes hrits sont compatibles avec FT, ne mlangez pas les htes hrits ESX et les htes ESXi dans une paire FT.
Les htes ESXi ont accs aux mmes banques de donnes et rseaux des machines virtuelles. Reportezvous la section Pratiques d'excellence pour Fault Tolerance , page 51. Journalisation de Fault Tolerance et rseau vMotion configur. Reportez-vous la section Configurer la mise en rseau des machines htes , page 44. Cluster vSphere HA cr et activ. Reportez-vous la section Crer un cluster vSphere HA , page 23. vSphere HA doit tre activ avant la mise sous tension des machines virtuelles tolrantes aux pannes ou avant l'ajout d'un hte dans un cluster qui prend dj en charge des machines virtuelles tolrantes aux pannes.
40
VMware, Inc.
Conditions requises pour les htes pour Fault Tolerance

Les conditions suivantes concernant les htes doivent tre remplies avant d'utiliser Fault Tolerance.
n
Les htes doivent avoir des processeurs appartenant au groupe de processeurs compatibles avec FT. Il est galement fortement recommand que les processeurs des htes soient compatibles entre eux. Consultez l'article de la base de connaissances de VMware sur http://kb.vmware.com/kb/1008027 pour obtenir des informations sur les processeurs pris en charge. Les htes doivent avoir une licence pour Fault Tolerance. Les htes doivent tre certifis pour Fault Tolerance. Reportez-vous la section http://www.vmware.com/resources/compatibility/search.php et slectionnez [Recherche par jeux comptatibles tolrants aux pannes] pour dterminer si vos htes sont certifis. La configuration de chaque hte implique l'activation de la virtualisation matrielle (HV) dans le BIOS.
n n
Pour confirmer la compatibilit des htes du cluster pour la prise en charge de Fault Tolerance, vous pouvez aussi effectuer des vrifications de conformit de profils comme dcrit dans Crer un cluster vSphere HA et en vrifier la conformit , page 47. REMARQUE Quand un hte ne peut pas prendre en charge Fault Tolerance, vous pouvez en consulter les raisons sur l'onglet [Rsum] de l'hte dans vSphere Client. Cliquez sur l'icne de lgende bleue ct du champ [Hte configur pour FT] et une liste des conditions de Fault Tolerance que l'hte ne satisfait pas s'affiche.
Conditions des machines virtuelles pour Fault Tolerance

Les conditions des machines virtuelles suivantes doivent tre remplies avant d'utiliser Fault Tolerance.
n
Aucun priphrique non pris en charge n'est attach la machine virtuelle. Reportez-vous la section Interoprabilit de Fault Tolerance , page 42. Les machines virtuelles doivent tre conserves dans des fichiers de RDM virtuel ou de disque de machine virtuelle (VMDK) qui sont approvisionns en lourd. Lorsqu'une machine virtuelle est conserve dans un fichier VMDK qui est approvisionn en allg et que vous tentez d'activer Fault Tolerance, un message vous avertit que le fichier VMDK doit tre converti. Vous devez mettre hors tension la machine virtuelle pour excuter la conversion. Les fonctions incompatibles ne doivent pas tre excutes avec les machines virtuelles tolrantes aux pannes. Reportez-vous la section Interoprabilit de Fault Tolerance , page 42. Les fichiers de machines virtuelles doivent tre conservs dans un stockage partag. Les solutions de stockage partag approuves comprennent Fibre Channel, iSCSI (matriel et logiciel), NFS et NAS. Seules les machines virtuelles avec un seul vCPU sont compatibles avec Fault Tolerance. Les machines virtuelles doivent tre excutes sur l'un des systmes d'exploitation clients pris en charge. Consultez l'article de la base de connaissances de VMware sur http://kb.vmware.com/kb/1008027 pour plus d'informations.
n n
VMware, Inc.
41
Interoprabilit de Fault Tolerance

Avant de configurer vSphere Fault Tolerance, vous devez connatre les fonctions et produits incompatibles avec Fault Tolerance.
Fonctions vSphere non prises en charge par Fault Tolerance

Les fonctions vSphere suivantes ne sont pas prises en charge pour les machines virtuelles tolrantes aux pannes.
n
Snapshots. Les snapshots doivent tre supprims ou engags avant l'activation de Fault Tolerance sur une machine virtuelle. De plus, il n'est pas possible de prendre des snapshots de machines virtuelles sur lesquelles Fault Tolerance est active. Stockage vMotion Il n'est pas possible d'appeler le stockage vMotion pour les machines virtuelles pour lesquelles Fault Tolerance est active. Pour migrer le stockage, il faut mettre hors tension temporairement Fault Tolerance et excuter l'action de stockage vMotion. Une fois ceci fait, vous pouvez ractiver Fault Tolerance. Clones lis. Il n'est pas possible d'activer Fault Tolerance sur une machine virtuelle qui est lie un clone et il n'est pas non plus possible de crer un clone li partir d'une machine virtuelle dont Fault Tolerance est active. Sauvegardes des machines virtuelles. Il n'est pas possible de sauvegarder une machine virtuelle ayant la FT active et utilisant vStorage API for Data Protection, VMware Data Recovery ou tout autre produit de sauvegarde similaire exigeant l'utilisation d'un snapshot de machine virtuelle, comme effectu par ESXi. Pour sauvegarder une machine virtuelle tolrante aux pannes de cette faon, il faut pralablement dsactiver la tolrance aux pannes, puis la ractiver aprs la sauvegarde. Les snapshots de stockage bass sur une baie n'affectent pas la tolrance aux pannes.
Fonctions et priphriques incompatibles avec Fault Tolerance

Pour qu'une machine virtuelle soit compatible avec Fault Tolerance, celle-ci ne doit pas utiliser les fonctions ou priphriques suivants. Tableau 3-1. Fonctions et priphriques incompatibles avec Fault Tolerance et les actions correctives
Fonction ou priphrique incompatible Machines virtuelles multiprocesseur symtrique (SMP). Seules les machines virtuelles avec un seul vCPU sont compatibles avec Fault Tolerance. Mappage disque brut physique (RDM). Action corrective Reconfigurez la machine virtuelle comme vCPU unique. De nombreuses charges de travail prsentent de bonnes performances avec une configuration vCPU unique. Reconfigurez les machines virtuelles avec des priphriques virtuels pris en charge par des RDM physiques de faon ce qu'ils utilisent des RDM virtuels la place. Retirez le lecteur de CD-ROM ou de disquettes virtuels ou reconfigurez la sauvegarde avec une image ISO installe sur le stockage partag. Si la paravirtualisation n'est pas requise, reconfigurez la machine virtuelle sans VMI ROM. Dconnectez ces priphriques de la machine virtuelle. Dsactivez la configuration NPIV de la machine virtuelle Cette fonction n'est pas prise en charge par Fault Tolerance et doit donc tre dsactive. Fault Tolerance ne prend pas en charge les machines virtuelles qui sont configures avec les adaptateurs rseaux virtuelles vlance. Toutefois, vmxnet2, vmxnet3 et e1000 sont intgralement pris en charge.
Lecteur de CD-ROM ou de disquettes virtuels pris en charge par un priphrique physique ou distant. Clients paravirtualiss. Priphrique USB et audio. Virtualisation d'identification N-Port (NPIV). relais de adaptateurs rseau Pilotes rseau vlance.
42
VMware, Inc.
Tableau 3-1. Fonctions et priphriques incompatibles avec Fault Tolerance et les actions correctives (suite)
Fonction ou priphrique incompatible Disques virtuels pris en charge par des disques de provisionnement lourds ou lgers dont les fonctions de cluster ne sont pas actives. Connexion de priphriques chaud Action corrective Lorsque vous activez Fault Tolerance, la conversion au format de disque appropri est effectue par dfaut. Vous devez mettre hors tension la machine virtuelle pour dclencher cette conversion. La fonction de connexion chaud est automatiquement dsactive pour les machines virtuelles tolrantes aux pannes. Pour la connexion des priphriques chaud (ajout ou suppression), vous devez mettre hors tension temporairement Fault Tolerance, effectuer la connexion chaud, puis ractiver Fault Tolerance. REMARQUE Lorsque vous utilisez Fault Tolerance, la modification des paramtres d'une carte rseau virtuelle pendant le fonctionnement d'une machine virtuelle constitue une connexion chaud, car cela exige de dbrancher la carte rseau, puis de la rebrancher . Prenons l'exemple d'une carte rseau virtuelle pour une machine virtuelle en cours d'excution. Si vous modifiez le rseau auquel la carte rseau virtuelle est connecte, la tolrance aux pannes doit pralablement tre arrte. EPT/RVI est automatiquement dsactiv pour les machines virtuelles pour lesquelles Fault Tolerance est active. Dconnectez ces priphriques de la machine virtuelle. Utilisez les adresses IPv4 avec la carte rseau de journalisation FT. Fault Tolerance ne prend pas en charge les priphriques vido dont la 3D est active.
Extended Page Tables/Rapid Virtualization Indexing (EPT/RVI). Ports srie ou parallles IPv6 Priphriques vido dont la 3D est active.
Prparer votre cluster et vos htes Fault Tolerance

Pour activer vSphere Fault Tolerance pour votre cluster, les conditions pralables de la fonction doivent tre remplies et il est ncessaire d'effectuer quelques tapes de configuration sur les htes. Une fois ces tapes accomplies et votre cluster cr, vous pouvez aussi vrifier que la configuration est conforme aux exigences requises pour l'activation de Fault Tolerance. Les tches devant tre effectues avant de tenter d'activer Fault Tolerance pour le cluster sont les suivantes :
n
Activer la vrification du certificat de l'hte (s'il s'agit d'une mise niveau d'une ancienne version de vCenter Server) Configurer la mise en rseau de chaque hte Crer un cluster vSphere HA, ajouter des htes et vrifier la conformit
n n
Lorsque le cluster et les htes sont prts, vous pouvez activer Fault Tolerance pour vos machines virtuelles. Reportez-vous la section Activer Fault Tolerance pour des machines virtuelles , page 49.
VMware, Inc.
43
Activer la vrification du certificat de l'hte

La vrification du certificat de l'hte permet de configurer les htes ESXi de faon ce qu'ils vrifient leurs identits mutuelles, ce qui contribue scuriser l'environnement. La vrification du certificat de l'hte est requise pour les htes ESXi sur lesquels rsident les machines virtuelles tolrantes aux pannes. Si vous avez install la version 4.1 de VMware vCenter Server, la vrification du certificat de l'hte est active automatiquement. Si vous avez mis niveau partir d'une version antrieure, vous devez effectuer la procdure manuellement. Au cours de cette procdure, vous verrez la liste des htes et leur certificat pour vrification. Vous pouvez vrifier le certificat de l'hte avant de valider l'activation de la vrification du certificat. Les htes non vrifis au cours de cette tape doivent tre vrifis et reconnects manuellement. Procdure 1 2 Connectez vSphere Client vCenter Server. Slectionnez [Administration] , puis [Paramtres vCenter Server] . La fentre [Paramtres vCenter Server] apparat. 3 4 5 Cliquez sur [Paramtres SSL] dans le panneau gauche. Cochez la case [vCenter exige des certificats SSL d'htes vrifis] . Cliquez sur [OK] .
Configurer la mise en rseau des machines htes

Vous devez configurer deux commutateurs rseau diffrents sur chacun des htes que vous souhaitez ajouter un cluster vSphere HA, de faon ce que l'hte prenne aussi en charge vSphere Fault Tolerance. Pour activer Fault Tolerance d'un hte, vous devez excuter deux fois cette procdure, une fois pour chaque option de groupe de ports afin de vous assurer qu'il y a suffisamment de bande passante disponible pour la journalisation de Fault Tolerance. Slectionnez une option, terminez la procdure, et recommencez-la une seconde fois en slectionnant l'autre option de groupes de port. Prrequis Des adaptateurs rseau (NIC) de plusieurs giga-octets sont ncessaires. Pour chaque hte compatible avec Fault Tolerance (Fault Tolerance), il faut au minimum deux adaptateurs rseau physiques de plusieurs gigaoctets : par exemple, l'une ddie la journalisation de Fault Tolerance et l'autre ddie vMotion. VMware recommande trois adaptateurs rseau ou davantage pour assurer la disponibilit. REMARQUE Les NIC de journalisation vMotion et FT doivent se trouver sur des sous-rseaux diffrents. Par ailleurs, l'IPv6 n'est pas pris en charge sur la NIC de journalisation FT. Procdure 1 2 3 Connectez vSphere Client vCenter Server. Dans l'inventaire de vSphere Server, slectionnez l'hte et cliquez sur l'onglet [Configuration] . Slectionnez [Mise en rseau] sous [Matriel] , puis cliquez sur le lien [Ajouter gestion rseau] . L'assistant Ajouter un rseau apparat. 4 5 6 Slectionnez [VMkernel] sous [Types connexion] et cliquez sur [Suivant] . Slectionnez [Crer un commutateur virtuel] et cliquez sur [Suivant] . Donnez une tiquette au commutateur.
44
VMware, Inc.
7 8 9
Slectionnez [Utiliser ce groupe de ports pour vMotion] ou [Utiliser ce groupe de ports pour la journalisation de Fault Tolerance] puis cliquez sur [Suivant] . Indiquez une adresse IP et un masque de sous-rseau et cliquez sur [Suivant] . Cliquez sur [Terminer] .
Lorsque vous avez cr la fois un commutateur virtuel de journalisation vMotion et de Fault Tolerance, vous pouvez crer d'autres commutateurs virtuels en cas de besoin. Ajoutez ensuite l'hte au cluster et suivez les tapes ncessaires l'activation de Fault Tolerance. Suivant Pour confirmer la russite de l'activation de vMotion et de Fault Tolerance sur l'hte, consultez l'onglet [Rsum] correspondant dans le vSphere Client. Dans le volet Gnral, les champs [vMotion activ] et [Hte configur pour FT] doivent tre dfinis sur oui. REMARQUE Si vous configurez la mise en rseau pour la prise en charge de Fault Tolerance mais que vous dsactivez ensuite le port de journalisation de Fault Tolerance, les paires de machines virtuelles Fault Tolerance qui sont dj sous tension le restent. Mais en cas de situation de basculement surgit, une nouvelle machine virtuelle secondaire n'est pas dmarre aprs le remplacement de la machine virtuelle principale par sa machine virtuelle secondaire. Par consquent, la nouvelle machine virtuelle principale fonctionne en tant non protge.
Exemple de configuration de la mise en rseau des htes de Fault Tolerance

Cet exemple dcrit la configuration du rseau hte de Fault Tolerance dans un dploiement typique avec quatre cartes NIC de 1 Go. Ce dploiement garantit un service adquat pour chaque type de trafic identifi dans cet exemple il pourrait tre considr comme la meilleure configuration possible. Fault Tolerance assure une disponibilit totale pendant toute la dure de la dfaillance d'un hte physique due une coupure de l'alimentation lectrique, une panique du systme ou toute autre raison de ce type. Les dfaillances au niveau du chemin de stockage ou du rseau, ou encore de tout autre composant du serveur physique qui n'ont pas de rpercussions sur l'tat oprationnel de l'hte ne provoquent pas un basculement de Fault Tolerance sur la machine virtuelle secondaire. Par consquent, les clients sont vivement encourags utiliser la redondance approprie (par exemple, l'association de adaptateurs rseau) pour rduire les risques de perte de connexion des machines virtuelles en faveur de composants d'infrastructure comme des rseaux ou des baies de stockage. Les rgles d'association des adaptateurs rseau sont configures sur les groupes de port vSwitch (vSS) (ou groupes de ports virtuels distribus pour vDS) et rgissent la manire dont vSwitch gre et rpartit le trafic sur les adaptateurs rseau physiques (vmnics) partir des machines virtuelles et des ports vmkernel. Un groupe de ports unique est gnralement utilis pour chaque type de trafic, chacun tant gnralement associ un VLAN diffrent. Instructions de configuration de mise en rseau des htes Les directives suivantes vous permettent de configurer la mise en rseau des htes pour la prise en charge de Fault Tolerance avec diffrentes combinaisons de types de trafic (par exemple, NFS) et plusieurs adaptateurs rseau physiques.
n
Rpartissez chaque association de adaptateurs rseau sur deux commutateurs physiques assurant la continuit des domaines L2 pour chaque VLAN entre les deux commutateurs physiques. Utilisez des rgles d'association dterministe pour vous assurer que des types de trafic particuliers prsentent une affinit avec une carte rseau particulire (active/veille) ou un ensemble de adaptateurs rseau (par exemple, ID port virtuel d'origine). Quand des rgles active/veille sont utilises, associez les types de trafic pour rduire les rpercussions dans le cas de basculement o les deux types de trafic partagent un vmnic.
VMware, Inc.
45
Quand des rgles active/veille sont utilises, configurez tous les adaptateurs actifs pour un type de trafic particulier (par exemple, journalisation de la tolrance aux pannes) sur le mme commutateur physique. Cela rduit le nombre de bonds rseau et diminue les possibilits de surabonner le commutateur des liaisons de commutateurs.
Exemple de configuration avec quatre cartes NIC de 1 Go Figure 3-2 dcrit la configuration du rseau pour un seul hte ESXi avec quatre cartes NIC de 1 Go prenant en charge Fault Tolerance. Les autres htes du cluster FT seraient configurs de la mme manire. Cet exemple utilise quatre groupes de ports configurs comme suit :
n
VLAN A : Port rseau des machines virtuelles actif au niveau du groupe sur vmnic2 (vers le commutateur physique #1) ; en veille sur vmnic0 (vers le commutateur physique #2.) VLAN B : Port rseau de gestion actif au niveau du groupe sur vmnic0 (vers le commutateur physique #2) ; en veille sur vmnic2 (vers le commutateur physique #1.) VLAN C : Port de vMotion actif au niveau du groupe sur vmnic1 (vers le commutateur physique #2) ; en veille sur vmnic3 (vers le commutateur physique #1.) VLAN D : Port de journalisation FT actif au niveau du groupe sur vmnic3 (vers le commutateur physique #1) ; en veille sur vmnic1 (vers le commutateur physique #2.)
La journalisation vMotion et FT peut partager le mme VLAN (configurez le mme nombre de VLAN dans les deux groupes de ports), mais exige que leurs propres adresses IP uniques rsident dans diffrents sousrseaux IP. Toutefois, des VLAN spars peuvent tre prfrs si des restrictions de qualit de service (QoS) sont en vigueur sur le rseau physique avec des rgles de QoS bases sur VLAN. QoS est particulirement utilise lorsque le trafic concurrent intervient, par exemple, lorsque plusieurs bonds de commutateurs physiques sont utiliss ou quand un basculement a lieu et que plusieurs types de trafic entrent en concurrence pour des ressources rseau. Figure 3-2. Exemple de configuration de mise en rseau pour Fault Tolerance
FT virtuel machine virtuel machine virtuel machine gestion Mise en rseau vmkernel vMotion
VLAN A
VLAN B
VLAN D
VLAN C
vmnic2 Joncteurs rseau VLAN sur des liaisons montantes Ports de commutateur physique configurs comme VLAN joncteurs et porte les VLAN A, B, C et D
vmnic0
vmnic3
vmnic1 vSwitch (vSS or vDS) dans Jonction de commutateur virtuel Mode (VST) balisage VLAN trames transmises liaison montante vers/ partir de vmnics
rgles d'association de groupes de ports active mode veille
physique commutateur 1
physique commutateur 2
46
VMware, Inc.
Crer un cluster vSphere HA et en vrifier la conformit

vSphere Fault Tolerance est utilis dans le cadre d'un cluster vSphere HA. Aprs avoir configur la mise en rseau de chaque hte, crez le cluster vSphere HA et ajoutez-y les htes. Vous pouvez vrifier que le cluster est configur correctement et est conforme aux exigences relatives l'activation russie de Fault Tolerance. Procdure 1 2 3 Connectez vSphere Client vCenter Server. Dans l'inventaire de vSphere Server, slectionnez le cluster et cliquez sur l'onglet [Conformit de profil] . Cliquez sur [Vrifier la conformit maintenant] pour excuter les tests de conformit. Pour visualiser les tests effectus, cliquez sur [Description] . Les rsultats du test de conformit sont affichs en bas de l'cran. Un hte est dsign comme tant conforme ou non conforme. REMARQUE Pour plus d'informations sur la cration d'un cluster vSphere HA, reportez-vous Chapitre 2, Crer et utiliser des clusters vSphere HA , page 11.
Assurer Fault Tolerance des machines virtuelles

Aprs avoir suivi toutes les tapes ncessaires l'activation de vSphere Fault Tolerance pour votre cluster, vous pouvez utiliser cette fonction en l'activant sur des machines virtuelles individuelles. L'option permettant d'activer Fault Tolerance n'est pas disponible (grise) si l'une de ces conditions s'applique :
n n n n
La machine virtuelle rside sur un hte qui n'a pas de licence pour la fonction. La machine virtuelle rside sur un hte qui est en mode maintenance ou standby. La machine virtuelle est dconnecte ou orpheline (son fichier .vmx n'est pas accessible). L'utilisateur n'a pas l'autorisation d'activer la fonction.
Si l'option pour activer Fault Tolerance est disponible, cette tche doit encore tre valide et peut chouer si certaines conditions n'est pas remplies.
Contrles de validation pour l'activation de Fault Tolerance

Plusieurs contrles de validation sont excuts sur une machine virtuelle avant de pouvoir activer Fault Tolerance.
n n n n n n n n
Le contrle de certificat SSL doit tre activ dans les paramtres de vCenter Server. L'hte doit se trouver dans un cluster HA vSphere ou un cluster mixte vSphere HA et DRS. L'hte doit avoir ESX/ESXi 4.0 ou ultrieur install. La machine virtuelle ne doit pas avoir plusieurs vCPU. La machine virtuelle ne doit pas avoir de snapshots. La machine virtuelle ne doit pas tre un modle. La machine virtuelle ne doit pas avoir vSphere HA dsactiv. Aucun priphrique vido dont la 3D est active ne doit tre prsent sur la machine virtuelle.
VMware, Inc.
47
Plusieurs vrifications de validation supplmentaires sont effectues pour les machines virtuelles sous tension (ou celles qui sont en cours de mise sous tension).
n
Le BIOS des htes o rsident les machines virtuelles tolrantes aux pannes doit avoir la virtualisation matrielle (HV, Hardware Virtualization) active. L'hte qui prend en charge la machine virtuelle principale doit avoir un processeur qui prend en charge Fault Tolerance. L'hte qui prend en charge la machine virtuelle secondaire doit avoir un processeur qui prend en charge Fault Tolerance et dont la famille ou le modle de CPU est le mme que l'hte qui prend en charge la machine virtuelle principale. Les composants matriels doivent tre certifis compatibles avec Fault Tolerance. Pour en avoir la confirmation, consultez le Guide de compatibilit VMware sur http://www.vmware.com/resources/compatibility/search.php et slectionnez [Recherche par ensembles compatibles tolrants aux pannes] . La combinaison du systme de la machine virtuelle d'exploitation invit et le processeur doit tre prise en charge par Fault Tolerance (par exemple, Solaris de 32 bits sur des processeurs AMD n'est pas actuellement pris en charge). Consultez l'article de la base de connaissances de VMware sur http://kb.vmware.com/kb/1008027 pour obtenir des informations sur les combinaisons de processeurs et les systmes d'exploitation clients pris en charge. La configuration de la machine virtuelle doit tre valide pour tre utilise avec une Fault Tolerance (par exemple, la configuration ne peut comporter aucun priphrique non pris en charge.).
Quand votre effort d'activation de Fault Tolerance pour une machine virtuelle russit aux contrles de validation, la machine virtuelle secondaire est cre. Le placement et le statut immdiat de la machine virtuelle secondaire dpendent de l'tat sous tension ou hors tension de la machine virtuelle principale quand vous avez activ Fault Tolerance. Si la machine virtuelle principale est sous tension :
n
L'tat complet de la machine virtuelle principale est copi et la machine virtuelle secondaire est cre, place sur un hte compatible distinct et mise sous tension si elle passe le contrle d'admission. L'tat de Fault Tolerance affich sur l'onglet [Rsum] de la machine virtuelle dans le vSphere Client est [Protg] .
Si la machine virtuelle principale est hors tension :

n
La machine virtuelle secondaire est cre immdiatement et enregistre dans le cluster d'un hte (Il doit tre enregistr sur un hte plus appropri lorsqu'il est mis sous tension.) La machine virtuelle secondaire est mise sous tension seulement aprs la mise sous tension de la machine virtuelle principale. L'tat de Fault Tolerance affich sur l'onglet [Rsum] de la machine virtuelle dans vSphere Client est [Non protg, VM inactive] . Quand vous essayez de mettre sous tension la machine virtuelle primaire aprs l'activation de Fault Tolerance, les contrles supplmentaires de validation sont excuts. Pour mettre sous tension correctement, la machine virtuelle ne doit pas employer la paravirtualisation (VMI). Aprs le passage de ces contrles, les machines virtuelles principales et secondaires sont mises sous tension et places sur les htes distincts et compatibles. L'tat de Fault Tolerance affich sur l'onglet [Rsum] de la machine virtuelle dans le vSphere Client est marqu [Protg] .
48
VMware, Inc.
Activer Fault Tolerance pour des machines virtuelles

Vous pouvez dmarrer vSphere Fault Tolerance par l'intermdiaire de vSphere Client. Quand Fault Tolerance est active, vCenter Server dsactive la limite de mmoire de la machine virtuelle et dfinit la rservation de mmoire en fonction de la taille de la mmoire de la machine virtuelle. Si Fault Tolerance reste active, il n'est pas possible de modifier la rservation de mmoire, sa taille, la limite ou les partages. Quand Fault Tolerance est dsactive, les valeurs d'origine de tous les paramtres qui ont t modifis ne sont pas restaures. Connectez vSphere Client vCenter Server en utilisant un compte ayant des droits d'accs administrateur au cluster. Procdure 1 2 Slectionnez les vues {[Htes & Clusters]}. Cliquez avec le bouton droit de la souris sur la machine virtuelle et slectionnez [Fault Tolerance] > [Dmarrer Fault Tolerance] . Si vous slectionnez plusieurs machines virtuelles, le menu [Fault Tolerance] est dsactiv. Vous devez activer Fault Tolerance pour une seule machine virtuelle la fois. La machine virtuelle spcifie est dsigne comme machine virtuelle principale et une machine virtuelle secondaire est tablie sur un autre hte. La machine virtuelle principale est dsormais tolrante aux pannes.
Afficher des informations sur les machines virtuelles tolrantes aux pannes
Vous pouvez visualiser les machines virtuelles tolrantes aux pannes dans l'inventaire de vCenter Server en utilisant le vSphere Client. REMARQUE Vous ne pouvez pas mettre hors tension Fault Tolerance de la machine virtuelle secondaire. Le volet vSphere Fault Tolerance apparat dans l'onglet [Rsum] pour la machine virtuelle principale et contient des informations sur la machine virtuelle. tat de Fault Tolerance Indique l'tat de Fault Tolerance de la machine virtuelle.
n
Protge. Indique que les machines virtuelles principale et secondaire sont sous tension et fonctionnent comme prvu.
VMware, Inc.
49
Non protge. Indique que la machine virtuelle secondaire ne fonctionne pas. Les raisons possibles sont rpertories dans le tableau. Tableau 3-2. Raisons de l'tat non protg de la machine virtuelle principale
Raison de l'tat non protg Dmarrage Description Fault Tolerance est en train de dmarrer la VM secondaire. Ce message n'est visible que pendant une courte dure. La machine virtuelle principale fonctionne sans machine virtuelle secondaire, ainsi la machine virtuelle principale n'est actuellement pas protge. Ceci se produit gnralement quand il n'y a aucun hte compatible dans le cluster disponible pour la machine virtuelle secondaire. Remdiez cette situation en plaant un hte compatible en ligne. S'il existe un hte compatible en ligne dans le cluster, il peut tre ncessaire d'approfondir la recherche. Dans certaines circonstances, la dsactivation de Fault Tolerance puis sa ractivation suffit pour corriger ce problme. Fault Tolerance est actuellement dsactive (aucune machine virtuelle secondaire ne fonctionne). Ceci se produit quand Fault Tolerance est dsactive par l'utilisateur ou quand vCenter Server dsactive Fault Tolerance aprs avoir chou dans la mise sous tension de la machine virtuelle secondaire. Fault Tolerance est active mais la machine virtuelle est hors tension. Mettez sous tension la machine virtuelle pour obtenir l'tat Protg.
VM secondaire ncessaire
Dsactiv
Machine virtuelle hors fonctionnement
Emplacement secondaire CPU secondaire totale Mmoire secondaire totale Intervalle vLockstep
Affiche l'hte ESXi sur lequel la machine virtuelle secondaire est hberge. Indique l'utilisation du CPU de la machine virtuelle secondaire, exprime en MHz. Indique l'utilisation de la mmoire de la machine virtuelle secondaire, exprime en Mo. Intervalle de temps (en secondes) requis pour que la machine virtuelle secondaire corresponde l'tat d'excution actuel de la machine virtuelle primaire. En gnral, cet intervalle est infrieur une demi-seconde. Aucun tat n'est perdu pendant un basculement, quelle que soit la valeur de l'intervalle vLockstep. Capacit rseau utilise pour envoyer les informations de journalisation de vSphere Fault Tolerance, de l'hte excutant la machine virtuelle principale l'hte excutant la machine virtuelle secondaire.
Largeur de bande de journalisation
50
VMware, Inc.
Pour chaque hte configur pour prendre en charge Fault Tolerance, vous pouvez consulter les informations sur ses machines virtuelles tolrantes aux pannes en accdant l'onglet [Rsum] de l'hte dans vSphere Client. La section [Fault Tolerance] de cet onglet affiche le nombre total de machines virtuelles primaires et secondaires rsidant sur l'hte et le nombre de ces machines virtuelles qui sont sous tension. Si l'hte est ESX/ESXi 4.1 ou ultrieur, cette section affiche galement la version de Fault Tolerance excute par l'hte. Autrement, elle mentionne le numro de build de l'hte. Pour que deux htes soient compatibles, ils doivent avoir des numros de version FT identiques ou des numros de compilation d'hte identiques.
Pratiques d'excellence pour Fault Tolerance

Pour garantir des rsultats optimaux de Fault Tolerance, VMware recommande de respecter certaines pratiques. En plus des informations suivantes, consultez le livre blanc Recommandations et considrations sur VMware Fault Tolerance sur http://www.vmware.com/resources/techresources/10040.
Configuration d'hte
Tenez compte des meilleures pratiques suivantes lors de la configuration des htes.
n
Les htes excutant les machines virtuelles principales et secondaires doivent fonctionner des frquences de processeur assez proches sinon la machine virtuelle secondaire risque de redmarrer plus souvent. Les fonctions de gestion de l'alimentation de la plate-forme qui ne sont pas rgles selon la charge de travail (modes de limitation de puissance et de basse frquence pour conomiser de l'nergie, par exemple) peuvent entraner de fortes variations des frquences du processeur. Si des machines virtuelles secondaires sont redmarres rgulirement, dsactivez tous les modes de gestion de l'alimentation sur les htes excutant des machines virtuelles tolrantes aux pannes ou veillez ce que tous les htes soient excuts avec les mme modes de gestion de l'alimentation. Appliquez la mme configuration d'extension de jeux d'instructions (activ ou dsactiv) tous les htes. Le processus d'activation ou de dsactivation des jeux d'instructions varie en fonction du BIOS. Reportezvous la documentation du BIOS de vos htes pour plus d'informations sur la configuration des jeux d'instructions.
Clusters homognes
vSphere Fault Tolerance peut fonctionner dans des clusters contenant des htes non uniformes, mais il est prfrable que les clusters aient des nuds compatibles. Au moment de la construction du cluster, tous les htes doivent tre configurs comme suit :
n n n n n
Processeurs appartenant au mme groupe de processeurs compatibles. Accs commun aux banques de donnes utilises par les machines virtuelles. La mme configuration rseau de machines virtuelles. La mme version d'ESXi. Le mme numro de version de Fault Tolerance (ou numro de compilation d'hte pour les htes antrieurs ESX/ESXi 4.1). Les mmes paramtres de BIOS (gestion de l'alimentation et hyperthreading) pour tous les htes.
Excutez [Vrifier la conformit] pour identifier les incompatibilits et les corriger.
Performances
Pour accrotre la bande passante disponible pour le trafic de journalisation entre les machines virtuelles principales et secondaires, utilisez une carte rseau de 10 Gbit et activez l'utilisation des Trames jumbo.
VMware, Inc.
51
Stocker les images ISO sur des stockages partags pour un accs permanent
Les images ISO auxquelles accdent les machines virtuelles dont Fault Tolerance est active doivent tre conserves sur des stockages partags accessibles aux deux instances de la machine virtuelle tolrante aux pannes. Si vous utilisez cette configuration, le CD-ROM prsent dans la machine virtuelle continue de fonctionner correctement, mme en cas de basculement. Pour les machines virtuelles dont Fault Tolerance est active, il est possible d'utiliser les images ISO qui sont uniquement accessibles par la machine virtuelle principale. Dans ce cas, la machine virtuelle principale peut accder l'image ISO, mais en cas de basculement, le CD-ROM signale les erreurs comme s'il n'y avait pas de support. Cette situation peut tre tolre si le CD-ROM est utilis pour une opration provisoire et non critique comme une installation.
viter les partitions de rseau

Une partition de rseau survient quand un cluster vSphere HA connat une dfaillance du rseau de gestion qui isole certains htes de vCenter Server et les isole les uns des autres. Reportez-vous la section Partitions de rseau , page 13. En cas de partition, la protection de Fault Tolerance peut tre rduite. Dans un cluster vSphere HA partitionn utilisant Fault Tolerance, la machine virtuelle principale (ou sa machine virtuelle secondaire) pourrait se retrouver dans une partition gre par un hte principal qui n'est pas responsable de cette machine virtuelle. Si un basculement est ncessaire, une machine virtuelle secondaire est redmarre uniquement si la machine virtuelle principale se trouvait dans une partition gre par un hte principal qui en tait responsable. Pour rduire les risques de panne de votre rseau de gestion entranant une partition du rseau, suivez les recommandations figurant dans Meilleures pratiques pour la mise en rseau , page 33.
Mettre niveau les htes utiliss pour Fault Tolerance

Lorsque vous mettez niveau des htes qui contiennent des machines virtuelles tolrantes aux pannes, vrifiez que les machines virtuelles principales et secondaires continuent tre excutes sur des htes ayant le mme numro de version de tolrance aux pannes ou de numro de compilation d'hte (pour les htes antrieurs ESX/ESXi 4.1). Prrequis Vrifiez que vous possdez des privilges d'administrateur sur les clusters. Vrifiez que vous possdez des ensembles d'au moins quatre htes ESXi hbergeant des machines virtuelles tolrantes aux pannes qui sont sous tension. Si les machines virtuelles sont hors tension, les machines virtuelles principales et secondaires tolrantes aux pannes peuvent tre dplaces sur des htes de versions diffrentes. REMARQUE Cette procdure de mise niveau est adapte aux clusters de quatre nuds au minimum. Les mmes instructions peuvent tre suivies avec un plus petit cluster, mais les intervalles sans protection seront lgrement plus longs. Procdure 1 2 3 4 5 Avec vMotion, migrez les machines virtuelles tolrantes aux pannes partir des deux htes. Mettez niveau les deux htes vacus de faon ce qu'ils aient la mme version d'ESXi. Dsactivez Fault Tolerance sur la machine virtuelle principale. Avec vMotion, dplacez la machine virtuelle principale vers l'un des htes mis niveau. Activez Fault Tolerance sur la machine virtuelle principale qui a t dplace.
52
VMware, Inc.
6 7
Rpteztape 1 tape 5 pour autant de paires de machines virtuelles tolrantes aux pannes que les htes mis niveau peuvent en accueillir. Avec vMotion, rpartissez les machines virtuelles tolrantes aux pannes.
Tous les htes ESXi d'un cluster sont mis niveau.
Recommandations de configuration de vSphere Fault Tolerance

VMware recommande de respecter certaines directives lors de la configuration de Fault Tolerance.
n
En plus des machines virtuelles non tolrantes aux pannes, vous ne devez pas avoir plus de quatre machines virtuelles (principales ou secondaires) tolrantes aux pannes par hte unique. Le nombre de machines virtuelles tolrantes aux pannes que vous pouvez faire tourner en toute scurit sur chaque hte est fonction de la taille et de la charge de travail, variables, de l'hte ESXi et des machines virtuelles. Si vous accdez au stockage partag par NFS, utilisez du matriel NAS ddi avec au moins une carte rseau 1 Gbit pour atteindre les performances rseaux requises pour le bon fonctionnement de Fault Tolerance. Veillez ce qu'un pool de ressources contenant des machines virtuelles tolrantes aux pannes dispose de rserves de mmoire dpassant la capacit de mmoire des machines virtuelles. La rserve de mmoire d'une machine virtuelle tolrante aux pannes est dfinie par la taille de la mmoire de la machine virtuelle lorsque Fault Tolerance est active. Sans cet excdent de pool de ressources, il risque de ne pas y avoir de mmoire disponible comme capacit supplmentaire. Utilisez 16 disques virtuels au maximum par machine virtuelle tolrante aux pannes. Pour assurer la redondance et une protection maximale de Fault Tolerance, il est recommand d'avoir au minimum trois htes par cluster. Dans une situation de basculement, on dispose ainsi d'un hte capable de grer la nouvelle machine virtuelle secondaire qui est cre.
n n
VMware, Inc.
53
54
VMware, Inc.
Index
A
adresse d'isolation rseau 33 Architecture vSphere HA 11 Association de adaptateurs rseau 34, 45 attributs avancs, vSphere HA 28 Auto Deploy 31
B
basculement transparent 9, 38
C
calcul de la taille du slot 17 Capacit de basculement actuelle 17, 19 Capacit de basculement configure 17, 19 cas d'utilisation, Fault Tolerance 39 certificats SSL 14 choix de l'hte principal 12 cluster vSphere HA contrle d'admission 16 cration 23, 24, 47 htrognit 22 hte esclave 12 hte principal 12, 13 meilleures pratiques 31 planification 11 Compatibilit amliore de vMotion 39 compte d'utilisateur vpxuser 14 conditions pralables, Fault Tolerance 40 configuration de la mise en rseau, Fault Tolerance 44, 45 configuration des options avances de vSphere HA 29 continuit d'activit 7 contrle d'admission activation 25 rgle 25 types 16 vSphere HA 16 contrles de validation 47 cration d'un cluster vSphere HA 23
das.isolationaddress 29, 33 das.isolationshutdowntimeout 26, 29 das.maxftvmsperhost 39 das.slotcpuinmhz 17, 29 das.slotmeminmb 17, 29 das.usedefaultisolationaddress 29 das.vmcpuminmhz 17, 19, 29 das.vmmemoryminmb 29 Dfaillances d'hte tolres par le cluster 17, 31 Dfinir les htes de basculement 21 dmarrage de vSphere HA 25 Distributed Resource Scheduler (DRS) dmarrage 25 et Fault Tolerance 42 utilisation avec vSphere Fault Tolerance 39 utilisation avec vSphere HA 15 DRS de stockage 31
E
quilibrage de charge 39 tat de Fault Tolerance Dmarrage 49 Dsactiv 49 Machine virtuelle hors fonctionnement 49 VM secondaire ncessaire 49 tiquettes rseau 33 EVC 39 vnements et alarmes, paramtre 31 Extended Page Tables (EPT) 42
F
Fault Tolerance activation 43 cas d'utilisation 39 conditions pralables 40 configuration de la mise en rseau 44, 45 configuration vSphere 40 continuit de la disponibilit 9 contrles de validation 47 CPU secondaire totale 49 dmarrage 49 emplacement secondaire 49 interoprabilit 42 Intervalle vLockstep 49 journalisation 44, 45
D
das.heartbeatdsperhost 14, 29 das.ignoreinsufficienthbdatastore 29 das.iostatsinterval 27, 29
VMware, Inc.
55
Largeur de bande de journalisation 49 liste de vrification 40 meilleures pratiques 51 Mmoire secondaire totale 49 messages d'erreurs 37 prsentation 38 recommandations relatives la configuration 53 rgles d'anti-affinit 38 restrictions pour l'activation 47 vrification de conformit 47 version 40 Fault Tolerance la demande 39 fichiers de journalisation 14 Fonction de dmarrage et d'arrt de machine virtuelle 23 fonction de surveillance de l'hte 25, 33 fragmentation des ressources 22
Fault Tolerance 51 Mise en rseau vSphere HA 33 messages d'erreurs Fault Tolerance 37 vSphere HA 11 minimiser les interruptions de service 7 mise niveau d'htes avec des machines virtuelles tolrantes aux pannes 52 Mise en rseau vSphere HA meilleures pratiques 33 Redondance des chemins d'accs 34 modifier les paramtres du cluster 24 multiprocesseur symtrique (SMP) 42
N
Nombre maximum de rinitialisations par machine virtuelle 27 noms des groupes de ports 33
G
Gestion de l'alimentation distribue (DPM) 15, 16
P
paramtre de priorit de redmarrage des machines virtuelles 26 paramtre de rponse l'isolement d'un hte 26 paramtres de cluster 24 paramtres de remplacement des machines virtuelles 26, 31 paravirtualisation 42 partition de rseau 1214, 51 passerelle par dfaut 33 personnalisation de vSphere HA 28 planification d'un cluster vSphere HA 11 port TCP 14 port UDP 14 PortFast 33 ports de pare-feu 14, 33 Pourcentage de ressources de cluster rserves 19 Pourcentage de ressources du cluster rserves 31 protection des machines virtuelles 12, 13 Public cibl 5
H
htes isolation rseau 12 mode maintenance 12, 15 htes de basculement 21 htes de basculement actuels 21
I
images ISO 51 Informations d'excution avances 17 interoprabilit, Fault Tolerance 42 Interruption imprvu 8 prvu 7 interruption de service imprvue 8 interruption de service prvue 7 interruption de vSphere HA 25 intervalles de statistiques d'E/S 27 IPv4 22, 42 IPv6 22, 42, 44
R
Rapid Virtualization Indexing (RVI) 42 RDM 40, 42 recherche de DNS 22 rgle de contrle d'admission choix 22 Dfaillances d'hte tolres par le cluster 17 Dfinir les htes de basculement 21 Pourcentage de ressources de cluster rserves 19 rgles d'affinit 38, 39
J
Journalisation de la tolrance aux pannes 38
M
meilleures pratiques clusters vSphere HA 31
56
VMware, Inc.
Index
rgles d'affinit machine virtuelle/machine virtuelle 21 rgles d'anti-affinit 38 rseau de gestion 22, 33
S
SAN iSCSI 40 sensibilit de surveillance 27 signal de pulsation de banque de donnes 12, 14 slot 17 snapshots 42 Statut oprationnel du cluster 31 stockage iSCSI 40 NAS 40, 53 NFS 40, 53 Storage vMotion 7, 31, 42 Surveillance d'application 12, 27 Surveillance de VM 12, 27 surveillance de vSphere HA 31
T
tolrance des dfaillances d'hte 17
V
validit du cluster 31 vrification de conformit, Fault Tolerance 47 vrification du certificat de l'hte 40, 44 Virtualisation d'identification N-Port (NPIV) 42 Virtualisation matrielle (HV) 40, 47 VLAN 45 VMDK 40 VMFS 14, 33 VMware Tools 27 VMware vLockstep 9, 37, 38 vSphere HA attributs avancs 28 avantages 8 dmarrage 25 interruption 25, 31 liste de vrification 22 messages d'erreurs 11 paramtres de cluster 23 personnalisation 28 reprise d'activit suite une interruption 8 surveillance 31
VMware, Inc.
57
58
VMware, Inc.

Vsphere Disponibilité

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

Vsphere Disponibilité

Uploaded by

Copyright:

Available Formats

vSphere Disponibilit

Mise jour 1 ESXi 5.0 vCenter Serveur 5.0

VMware, Inc. 3401 Hillview Ave. Palo Alto, CA 94304 www.vmware.com

Table des matires

propos de Disponibilit de vSphere 5

1 Continuit d'activit et minimisation des interruptions de service 7

2 Crer et utiliser des clusters vSphere HA 11

3 Assurer Fault Tolerance des machines virtuelles 37

propos de Disponibilit de vSphere

Continuit d'activit et minimisation des interruptions de service

Rduire les interruptions de service prvues

Prvenir les interruptions de service imprvues

vSphere HA assure une reprise d'activit rapide suite une interruption

Chapitre 1 Continuit d'activit et minimisation des interruptions de service

Cots et configuration matrielle rduits

Disponibilit accrue des applications

Intgration DRS et vMotion

vSphere Fault Tolerance assure la continuit de la disponibilit

Crer et utiliser des clusters vSphere HA

Hte matre et htes esclaves

Types de pannes des htes et dtection

Un hte cesse de fonctionner (autrement dit, il est dfaillant).

Chapitre 2 Crer et utiliser des clusters vSphere HA

Signal de pulsation de banque de donnes

Chapitre 2 Crer et utiliser des clusters vSphere HA

Connexions vSphere HA scurises

Vrification du certificat SSL de l'hte requise

Utilisation conjointe de vSphere HA et DRS

Contrle d'admission vSphere HA

Chapitre 2 Crer et utiliser des clusters vSphere HA

Rgles de contrle d'admission Dfaillances d'hte tolres par le cluster

Calcul de la taille du slot

Utiliser les slots pour dterminer la capacit de basculement actuelle

Informations d'excution avances

Exemple : Rgles de contrle d'admission Dfaillances d'hte tolres par le cluster

Chapitre 2 Crer et utiliser des clusters vSphere HA

VM3 1 Ghz 2 Go taille du slot 2 Ghz, 2 Go

6 slots restants Si H1 est dfectueux

Rgles de contrle d'admission Pourcentage de ressources de cluster rserves

Calcul de la Capacit de basculement actuelle

Exemple : Rgles de contrle d'admission Pourcentage de ressources de cluster rserves

Chapitre 2 Crer et utiliser des clusters vSphere HA

besoins totaux en ressources 7 Ghz, 6 Go H1 9 Ghz 9 Go H2 9 Ghz 6 Go H3 6 Ghz 6 Go

ressources totales de l'hte 24 GHz, 21 Go

Rgles de contrle d'admission Spcifier des htes de basculement

Choisir une rgle de contrle d'admission

viter la fragmentation des ressources

Flexibilit de la rservation des ressources de basculement

Htrognit des clusters

Liste de vrification de vSphere HA

Spcifications applicables un cluster vSphere HA

Chapitre 2 Crer et utiliser des clusters vSphere HA

Reportez-vous la section Meilleures pratiques pour la mise en rseau , page 33.

Crer un cluster vSphere HA

Crer un cluster vSphere HA

Cliquez sur [OK] pour fermer la bote de dialogue Paramtres du cluster.

Vous disposez dsormais d'un cluster vSphere HA configur et rempli d'htes.

Chapitre 2 Crer et utiliser des clusters vSphere HA

Fonctionnalits des clusters

Dmarrer vSphere DRS

Il est possible de modifier les fonctions des clusters par la suite.

Activer ou dsactiver le contrle d'admission

Options des machines virtuelles