Professional Documents
Culture Documents
Ce document prend en charge la version de chacun des produits rpertoris, ainsi que toutes les versions publies par la suite jusqu'au remplacement dudit document par une nouvelle dition. Pour rechercher des ditions plus rcentes de ce document, rendezvous sur : http://www.vmware.com/fr/support/pubs.
FR-000848-00
vSphere Disponibilit
Vous trouverez la documentation technique la plus rcente sur le site Web de VMware l'adresse : http://www.vmware.com/fr/support/pubs/ Le site Web de VMware propose galement les dernires mises jour des produits. Nhsitez pas nous transmettre tous vos commentaires concernant cette documentation ladresse suivante : docfeedback@vmware.com
Copyright 20092012 VMware, Inc. Tous droits rservs. Ce produit est protg par les lois amricaines et internationales relatives au copyright et la proprit intellectuelle. Les produits VMware sont protgs par un ou plusieurs brevets rpertoris l'adresse http://www.vmware.com/go/patents-fr. VMware est une marque dpose ou une marque de VMware, Inc. aux tats-Unis et/ou dans d'autres juridictions. Toutes les autres marques et noms mentionns sont des marques dposes par leurs propritaires respectifs.
VMware, Inc. 100-101 Quartier Boieldieu 92042 Paris La Dfense France www.vmware.com/fr
VMware, Inc.
Fonctionnement de vSphere HA 11 Contrle d'admission vSphere HA 16 Liste de vrification de vSphere HA 22 Crer un cluster vSphere HA 23 Personnaliser le comportement de vSphere HA 28 Meilleures pratiques pour les clusters vSphere HA 31
Fonctionnement de Fault Tolerance 38 Utiliser Fault Tolerance avec DRS 39 Cas d'utilisation de Fault Tolerance 39 Liste de vrification de Fault Tolerance 40 Interoprabilit de Fault Tolerance 42 Prparer votre cluster et vos htes Fault Tolerance 43 Assurer Fault Tolerance des machines virtuelles 47 Afficher des informations sur les machines virtuelles tolrantes aux pannes 49 Pratiques d'excellence pour Fault Tolerance 51 Recommandations de configuration de vSphere Fault Tolerance 53
Index 55
VMware, Inc.
vSphere Disponibilit
VMware, Inc.
Disponibilit vSphere prsente les solutions permettant d'assurer la continuit d'activit, et explique notamment comment mettre en place vSphere High Availability (HA) et vSphere Fault Tolerance.
Public cibl
Ces informations sont destines tous ceux qui veulent assurer la continuit d'activit l'aide des solutions vSphere HA et Fault Tolerance. Les informations fournies dans ce manuel sont destines aux administrateurs systme Windows ou Linux expriments qui connaissent le fonctionnement de la technologie des machines virtuelles et des centres de donnes.
VMware, Inc.
vSphere Disponibilit
VMware, Inc.
Qu'elles soient prvues ou imprvues, les interruptions de service engendrent des cots considrables. Cependant les solutions assurant des niveaux levs de disponibilit sont gnralement chres et difficiles implmenter et grer. Les logiciels de VMware assurent facilement et moindre cot un niveau lev de disponibilit pour les applications importantes. Avec vSphere, les entreprises peuvent augmenter facilement le niveau de disponibilit de base assur pour toutes les applications et fournir des niveaux levs de disponibilit plus facilement et moindre frais. Avec vSphere, vous pouvez :
n n n
Assurer une disponibilit leve quels que soient les matriels, le systme d'exploitation et les applications. Rduire les interruptions de service prvues pour les oprations de maintenance ordinaires. Assurer la restauration automatique en cas de dysfonctionnement.
vSphere permet de rduire les interruptions de service prvues, d'viter des interruptions de service imprvues et de rcuprer rapidement suite des interruptions. Ce chapitre aborde les rubriques suivantes :
n n n n
Rduire les interruptions de service prvues , page 7 Prvenir les interruptions de service imprvues , page 8 vSphere HA assure une reprise d'activit rapide suite une interruption , page 8 vSphere Fault Tolerance assure la continuit de la disponibilit , page 9
liminer les interruptions de service pour les oprations de maintenance ordinaires. liminer les plages de maintenance prvues. excuter la maintenance tout moment sans perturber les utilisateurs et les services.
VMware, Inc.
vSphere Disponibilit
vSphere vMotion et la fonctionnalit Storage vMotion de vSphere permettent aux entreprises de rduire les interruptions de service prvues car les charges de travail d'un environnement VMware peuvent tre dplaces dynamiquement sur d'autres serveurs physiques ou sur d'autres stockages sous-jacents sans interruption de service. Les administrateurs peuvent effectuer plus rapidement des oprations de maintenance entirement transparentes, sans devoir planifier des plages de maintenance peu pratiques.
Stockage partag. limine des points de panne isols en stockant les fichiers des machines virtuelles dans des espaces de stockage partags, comme Fibre Channel ou iSCSI SAN, ou encore NAS. Il est possible de faire appel aux fonctions de rplication et de mise en miroir SAN pour conserver les copies mises niveau des disques virtuels dans des sites de reprise. Association d'interfaces rseau. Assure la tolrance aux dfaillances des adaptateurs rseau individuelles. chemins multiples du stockage. Assure la tolrance aux dfaillances des emplacements de stockage.
n n
En outre, les fonctions vSphere HA et Fault Tolerance peuvent rduire ou liminer les interruptions de service imprvues en assurant respectivement la reprise rapide de l'activit suite une interruption et la continuit de la disponibilit.
Il protge contre une dfaillance du serveur en redmarrant les machines virtuelles sur d'autres htes au sein du cluster. Il protge contre les dfaillances des applications en surveillant en permanence une machine virtuelle et en la rinitialisant en cas de dtection d'une dfaillance.
Contrairement aux autres solutions de mise en cluster, vSphere HA fournit l'infrastructure ncessaire la protection de toutes les charges de travail :
n
Il n'est pas ncessaire d'installer des logiciels spciaux dans l'application ou sur la machine virtuelle. Toutes les charges de travail sont protges par vSphere HA. Une fois que vSphere HA est configur, aucune action n'est requise pour protger de nouvelles machines virtuelles. Elles sont protges automatiquement. Vous pouvez associer vSphere HA vSphere Distributed Resource Scheduler (DRS) pour assurer la protection contre les pannes, et pour rpartir la charge entre tous les htes d'un cluster.
VMware, Inc.
vSphere HA prsente plusieurs avantages face aux solutions de basculement habituelles : Configuration minimale Quand un cluster vSphere HA a t configur, toutes les machines virtuelles du cluster sont incluses dans le basculement sans configuration supplmentaire. La machine virtuelle fait office de conteneur portable pour les applications et elle peut tre dplace parmi les htes. Les administrateurs vitent ainsi de reproduire les configurations sur plusieurs machines. Lorsque vous utilisez vSphere HA, vous devez disposer de suffisamment de ressources pour le basculement des htes que vous souhaitez protger avec vSphere HA. Toutefois, le systme vCenter Server gre automatiquement les ressources et configure les clusters. Une application excute au sein d'une machine virtuelle a accs une disponibilit accrue. Comme la machine virtuelle peut rcuprer d'une dfaillance matrielle, toutes les applications qui dmarrent au moment de l'initialisation ont une disponibilit accrue sans accrotre la charge de calcul, mme si l'application n'est pas en cluster. En surveillant et en rpondant aux signaux de pulsation de VMware Tools et en redmarrant les machines virtuelles qui ne rpondent plus, elle assure galement une protection contre les dfaillances du systme d'exploitation client. En cas de dfaillance d'un hte et du redmarrage des machines virtuelles sur d'autres htes, DRS peut fournir des recommandations de migration ou faire migrer les machines virtuelle en quilibrant les ressources alloues. Si l'hte source et/ou l'hte de destination d'une migration sont dfaillants, vSphere HA peut faciliter la rcupration suite la dfaillance.
VMware, Inc.
vSphere Disponibilit
10
VMware, Inc.
Les clusters vSphere HA permettent un ensemble d'htes ESXi de travailler conjointement, de faon fournir aux machines virtuelles, en tant que groupe, un niveau de disponibilit suprieur celui d'un seul hte ESXi. Si vous envisagez de crer et d'utiliser un nouveau cluster vSphere HA, les options choisies affectent la manire dont ce cluster ragit aux pannes des htes ou des machines virtuelles. Avant de crer un cluster vSphere HA, vous devez savoir comment vSphere HA identifie les pannes et l'isolation de l'hte et comment il ragit ces situations. Vous devez aussi connatre le mode de fonctionnement du contrle d'admission de faon tre capable de choisir les rgles qui rpondent vos besoins de basculement. Aprs avoir cr un cluster, vous pouvez en personnaliser le comportement avec des attributs avancs et en optimiser les performances en suivant les recommandations. REMARQUE Un message d'erreur peut apparatre lorsque vous essayez d'utiliser vSphere HA. Pour plus d'informations sur les messages d'erreur relatifs vSphere HA, consultez l'article de la base de connaissances VMware sur http://kb.vmware.com/kb/1033634. Ce chapitre aborde les rubriques suivantes :
n n n n n n
Fonctionnement de vSphere HA , page 11 Contrle d'admission vSphere HA , page 16 Liste de vrification de vSphere HA , page 22 Crer un cluster vSphere HA , page 23 Personnaliser le comportement de vSphere HA , page 28 Meilleures pratiques pour les clusters vSphere HA , page 31
Fonctionnement de vSphere HA
vSphere HA assure la disponibilit leve des machines virtuelles en les rassemblant avec leurs htes respectifs dans un cluster. Les htes du cluster sont surveills et, en cas de dfaillance, les machines virtuelles d'un hte dfectueux sont redmarres sur d'autres htes. Lorsque vous crez un cluster vSphere HA, un seul hte est automatiquement slectionn comme hte matre. L'hte matre communique avec vCenter Server et surveille l'tat de toutes les machines virtuelles protges et des htes esclaves. Diffrents types de dfaillances d'htes sont possibles, et l'hte principal doit les dtecter et les traiter de faon adapte. L'hte principal doit faire la diffrence entre un hte dfaillant et un hte se trouvant dans une partition de rseau ou rseau isol. L'hte principal utilise le signal de pulsation de banques de donnes pour dterminer le type de dfaillance.
VMware, Inc.
11
vSphere Disponibilit
Surveiller l'tat des htes secondaires. Si un hte secondaire est dfaillant ou devient inaccessible, l'hte principal identifie les machines virtuelles qui doivent tre redmarres. Surveiller l'tat d'alimentation de toutes les machines virtuelles protges. Si une machine virtuelle est dfaillante, l'hte principal s'assure qu'elle est redmarre. Grce un moteur de placement local, l'hte principal dtermine galement o le redmarrage doit avoir lieu. Grer les listes d'htes et de machines virtuelles protges du cluster. Servir d'interface de gestion vCenter Server du cluster et rendre compte de l'tat de sant du cluster.
n n
Les htes secondaires apportent une contribution essentielle au cluster en excutant des machines virtuelles localement, en surveillant leur tat d'excution et en communiquant les mises jour d'tat l'hte principal. Un hte principal peut galement excuter et surveiller des machines virtuelles. Les htes principaux et les htes secondaires mettent en uvre les fonctions de surveillance de VM et d'application. La protection des machines virtuelles est l'une des fonctions de l'hte principal. Lorsqu'une machine virtuelle est protge, vSphere HA doit essayer de la remettre sous tension en cas de dfaillance. Un hte principal s'engage protger une machine virtuelle lorsqu'il constate que son tat d'alimentation passe de hors tension sous tension suite une action d'un utilisateur. En cas de basculement, l'hte principal doit redmarrer les machines virtuelles qui sont protges et dont il est responsable. Cette responsabilit est attribue l'hte principal qui a bloqu exclusivement un fichier dfini par le systme sur la banque de donnes contenant un fichier de configuration de machine virtuelle. vCenter Server indique si un hte est principal ou secondaire l'aide de l'tat d'hte vSphere HA. Cet tat figure dans l'onglet [Rsum] de l'hte dans vSphere Client et dans la vue Liste des htes d'un cluster ou d'une banque de donnes, si la colonne tat HA a t active. L'tat HA En cours d'excution (Principal) indique que l'hte fonctionne en tant qu'hte principal vSphere HA. L'tat Connect (Secondaire) indique que l'hte fonctionne en tant qu'hte secondaire vSphere HA. Il existe plusieurs autres tats pour indiquer qu'un choix est en cours ou qu'une erreur s'est produite. L'onglet [Rsum] de l'hte fournit un lien, ct de l'tat vSphere HA de l'hte, expliquant l'tat actuel. Pour plus d'informations sur les tats d'erreur, consultez la documentation Dpannage vSphere. REMARQUE Si vous dconnectez un hte d'un cluster, aucune des machines virtuelles enregistres sur cet hte n'est protge par vSphere HA.
12
VMware, Inc.
n n
Un hte est rseau isol. Un hte perd sa connexion rseau avec l'hte principal.
L'hte principal surveille la ractivit des htes secondaires du cluster. Cette communication s'effectue par l'change, toutes les secondes, de signaux de pulsation rseau. Lorsqu'un hte principal cesse de recevoir des signaux de pulsation d'un hte secondaire ou esclave, il vrifie la ractivit de l'hte avant de le dclarer dfaillant. Le contrle de ractivit effectu par l'hte principal permet de dterminer si l'hte secondaire change des signaux de pulsation avec une des banques de donnes. Reportez-vous la section Signal de pulsation de banque de donnes , page 14. Par ailleurs, l'hte principal vrifie si l'hte rpond aux pings ICMP envoys ses adresses IP de gestion. Si un hte principal est incapable de communiquer directement avec l'agent prsent sur un hte secondaire, si l'hte secondaire ne rpond pas aux pings ICMP, et si l'agent n'met pas de signaux de pulsation, il est considr comme dfaillant. Les machines virtuelles des htes sont redmarres sur d'autres htes. Si un tel hte secondaire change des signaux de pulsation avec une banque de donnes, l'hte principal considre qu'il se trouve dans une partition de rseau ou qu'il est rseau isol, et continue donc de surveiller l'hte et ses machines virtuelles. Reportez-vous la section Partitions de rseau , page 13. L'isolation du rseau de l'hte survient lorsqu'un hte, toujours en cours d'excution, ne parvient plus observer le trafic provenant des agents vSphere HA sur le rseau de gestion. Si un hte cesse d'observer ce trafic, il tente d'envoyer un ping aux adresses d'isolation du cluster. Si cela choue aussi, l'hte se dclare isol du rseau. L'hte principal surveille les machines virtuelles excutes sur un hte isol. S'il constate qu'elles s'arrtent, et s'il est responsable de ces machines virtuelles, il les redmarre. REMARQUE Si vous vous assurez que l'infrastructure rseau est suffisamment redondante et qu'un chemin d'accs au rseau est disponible en permanence, l'isolation du rseau de l'hte devrait se produire trs rarement.
Partitions de rseau
En cas de dfaillance du rseau de gestion d'un cluster vSphere HA, un sous-ensemble d'htes du cluster risque d'tre incapable de communiquer avec les autres htes sur le rseau de gestion. De multiples partitions peuvent se produire dans un cluster. Un cluster partitionn entrane une diminution de la protection des machines virtuelles et une altration des fonctions de gestion du cluster. Rparez le cluster partitionn ds que possible.
n
Protection des machines virtuelles. vCenter Server permet de mettre sous tension une machine virtuelle, mais celle-ci n'est protge que si elle s'excute sur la mme partition que l'hte principal qui en est responsable. L'hte principal doit communiquer avec vCenter Server. Un hte principal est responsable d'une machine virtuelle s'il a bloqu exclusivement un fichier dfini par le systme sur la banque de donnes contenant le fichier de configuration de la machine virtuelle. Gestion des clusters. vCenter Server ne peut communiquer qu'avec certains htes du cluster, et ne peut se connecter qu' un hte principal. Par consquent, il se peut que les modifications de configuration relatives vSphere HA ne prennent pas effet tant que le problme de partition n'est pas rsolu. Suite cette dfaillance, une des partitions pourrait s'excuter selon l'ancienne configuration, tandis qu'une autre utiliserait les nouveaux paramtres.
En cas de partition d'un cluster vSphere HA contenant des htes antrieurs ESXi 5.0, il se peut que vSphere HA mette sous tension, tort, une machine virtuelle qui avait t mise hors tension par l'utilisateur ou n'arrive pas redmarrer une machine virtuelle dfaillante. REMARQUE Lorsqu'un cluster vSphere HA est partitionn, vous ne pouvez ajouter un hte que sur la partition avec laquelle vCenter Server communique.
VMware, Inc.
13
vSphere Disponibilit
Scurit vSphere HA
Plusieurs fonctions de scurit permettent d'amliorer vSphere HA. Slectionner les ports de pare-feu ouverts Fichiers de configuration protgs par les autorisations du systme de fichiers Journalisation dtaille vSphere HA utilise les ports 8182 TCP et UDP pour la communication d'agent agent. Les ports de pare-feu s'ouvrent et se ferment automatiquement pour assurer qu'ils sont ouverts uniquement lorsque cela est ncessaire. vSphere HA stocke les informations de configuration sur le systme de stockage local ou sur le ramdisk s'il n'existe aucune banque de donnes locale. Ces fichiers sont protgs par les autorisations du systme de fichiers et sont accessibles uniquement par l'utilisateur racine. L'emplacement des fichiers journaux choisi par vSphere HA dpend de la version de l'hte.
n
Pour les htes ESXi 5.x, vSphere HA crit sur syslog uniquement par dfaut. Les journaux sont donc placs l'endroit indiqu dans la configuration de syslog. Les noms des fichiers journaux de vSphere HA sont prcds de fdm, fault domain manager (gestionnaire de domaine de pannes), qui est un service de vSphere HA.
14
VMware, Inc.
Pour les htes hrits ESXi 4.x et 3.x, vSphere HA crit sur /var/log/vmware/fdm sur le disque local, ainsi que sur syslog s'il est configur. Pour les htes hrits ESX 4.x et 3.x, vSphere HA crit sur /var/log/vmware/fdm.
vSphere HA se connecte aux agents vSphere HA l'aide d'un compte d'utilisateur, vpxuser, cr par vCenter Server. Ce compte est le mme que celui utilis par vCenter Server pour grer l'hte. vCenter Server cre un mot de passe de faon alatoire pource compte et le change rgulirement. La frquence de renouvellement du mot de passe est dfinie par le paramtre VirtualCenter.VimPasswordExpirationInDays de vCenter Server. Vous pouvez modifier ce paramtre l'aide de la commande Paramtres avancs de vSphere Client. Les utilisateurs ayant des privilges d'administration sur le dossier racine de l'hte peuvent galement se connecter l'agent. Toutes les communications entre vCenter Server et l'agent vSphere HA sont scurises par SSL. La communication d'agent agent utilise galement le protocole SSL sauf pour les messages d'lection, qui utilisent UDP. Les messages d'lection sont vrifis via SSL de sorte qu'un agent non autoris puisse empcher uniquement l'hte sur lequel l'agent s'excute d'tre choisi comme hte principal. Dans ce cas, un problme de configuration du cluster est mis afin que l'utilisateur soit inform du problme. vSphere HA exige que chaque hte dispose d'un certificat SSL vrifi. Chaque hte gnre un certificat auto-sign lors de son premier dmarrage. Ce certificat peut tre gnr une nouvelle fois ou remplac par un certificat mis par une autorit. Si le certificat est remplac, vSphere HA doit tre reconfigur sur l'hte. Si un hte se dconnecte de vCenter Server aprs la mise jour de son certificat et si l'agent de l'hte ESXi ou ESX est redmarr, vSphere HA est automatiquement reconfigur au moment o l'hte est reconnect vCenter Server. Si la dconnexion n'est pas due au fait que la vrification du certificat SSL de l'hte de vCenter Server est dsactive ce moment-l, vrifiez le nouveau certificat et reconfigurez vSphere HA sur l'hte.
Communication scurise
VMware, Inc.
15
vSphere Disponibilit
Dans certains cas, vSphere HA ne parvient pas basculer les machines virtuelles en raison de contraintes de ressources. Ceci peut se produire pour plusieurs raisons.
n
Le contrle d'admission HA est dsactiv et Gestion de l'alimentation distribue (DPM) est activ. Cela peut aboutir la consolidation par DPM des machines virtuelles sur un nombre infrieur d'htes et la mise en veille des htes vides, ce qui ne laisse pas suffisamment de rserve de capacit active pour effectuer un basculement. Les rgles (requises) d'affinit de machine virtuelle/hte peuvent limiter les htes sur lesquels certaines machines virtuelles peuvent tre places. Il peut y avoir suffisamment de ressources cumules mais celles-ci sont fragmentes sur plusieurs htes de sorte qu'elles ne peuvent pas tre utilises par les machines virtuelles pour le basculement.
Dans ces cas-l, vSphere HA peut utiliser DRS pour essayer d'ajuster le cluster (par exemple, en sortant les htes du mode veille ou en migrant les machines virtuelles pour dfragmenter les ressources du cluster) de sorte que HA puisse excuter les basculements. Si DPM est en mode manuel, vous devrez ventuellement confirmer les recommandations de mise sous tension des htes. De mme, si DPM est en mode manuel, vous devrez ventuellement confirmer les recommandations de migration. Si vous utilisez les rgles d'affinit entre machine virtuelle et hte requises, sachez que ces rgles doivent obligatoirement tre respectes. vSphere HA n'effectue pas de basculement si cela risque d'enfreindre une rgle. Pour plus d'informations sur DRS, consultez la documentation Gestion des ressources vSphere.
vSphere HA
Le contrle d'admission impose des contraintes d'utilisation des ressources et toute action contrevenant ces contraintes n'est pas autorise. Parmi les exemples d'actions qui peuvent tre interdites, on peut citer :
n n n
la mise sous tension d'une machine virtuelle. la migration d'une machine virtuelle sur un hte ou dans un cluster ou un pool de ressources. l'augmentation de la rserve de CPU ou de mmoire d'une machine virtuelle.
Parmi les trois types de contrle d'admission, seul le contrle d'admission vSphere HA peut tre dsactiv. Cependant, sans ce contrle, il est impossible de garantir que le nombre de machines virtuelles attendu puisse tre redmarr aprs une dfaillance. VMware dconseille de mettre hors tension le contrle d'admission, mais vous pouvez avoir besoin de le faire temporairement pour les raisons suivantes :
n
Si vous devez enfreindre les contraintes de basculement lorsqu'il n'y a pas suffisamment de ressources pour les prendre en charge (par exemple, si vous mettez les htes en mode veille pour en tester le fonctionnement avec DPM).
16
VMware, Inc.
Si un processus automatis doit effectuer des actions qui risquent d'enfreindre temporairement les contraintes de basculement (par exemple, dans le cadre d'une mise niveau dirige par vSphere Update Manager). Si vous devez excuter des tests ou des oprations de maintenance.
REMARQUE Lorsque le contrle d'admission vSphere HA est dsactiv, vSphere HA garantit qu'au moins deux htes du cluster sont sous tension mme si DPM est activ et peut regrouper toutes les machines virtuelles sur un seul hte. Ceci permet de garantir que le basculement est possible.
vSphere HA calcule la taille de CPU partir du CPU rserv par chaque machine virtuelle sous tension, en slectionnant la valeur la plus leve. Si aucun CPU n'a t rserv pour une machine virtuelle, une valeur de 32 MHz est dfinie par dfaut. Cette valeur peut tre modifie par l'attribut avanc das.vmcpuminmhz.) vSphere HA calcule la taille de la mmoire partir de la mmoire rserve (plus la capacit supplmentaire de mmoire) de chaque machine virtuelle sous tension, en slectionnant la valeur la plus leve. Il n'y a pas de valeur par dfaut pour la mmoire rserve.
Si le cluster contient des machines virtuelles ayant des valeurs de rservation bien plus leves que d'autres, celles-ci influeront sur le calcul de la taille du slot. Pour viter cela, vous pouvez prciser une limite suprieure pour le CPU ou le composant de mmoire de la taille du slot en utilisant respectivement les attributs avancs das.slotcpuinmhz ou das.slotmeminmb. Reportez-vous Attributs avancs de vSphere HA , page 29.
VMware, Inc.
17
vSphere Disponibilit
l'onglet [Ressources] de l'hte. Si tous les htes de votre cluster sont identiques, vous pouvez obtenir ces donnes en divisant les chiffres relatifs au cluster dans son ensemble par le nombre d'htes. Les ressources utilises des fins de virtualisation ne sont pas incluses. Seuls les htes qui sont connects, qui ne sont pas en mode maintenance et qui ne prsentent pas d'erreurs vSphere HA sont pris en compte. Le nombre maximum de slots pouvant tre pris en charge par chaque hte est alors dtermin. cette fin, la quantit de ressources CPU de l'hte est divise par le composant de CPU de la taille de slot et le rsultat est arrondi. Le mme calcul est fait pour la quantit de ressources de mmoire de l'hte. Ces deux valeurs sont compares et la plus basse quivaut au nombre de slots pouvant tre pris en charge par l'hte. La Capacit de basculement actuelle est calcule en dterminant le nombre d'htes (en commenant par le plus gros) pouvant tre dfectueux tout en conservant un nombre suffisant de slots pour satisfaire toutes les machines virtuelles sous tension.
Taille du slot. Nombre total de slots dans le cluster. Somme des slots pris en charge par les htes en tat de marche dans le cluster. Slots utiliss. Nombre de slots associs aux machines virtuelles sous tension. Ce nombre peut tre suprieur au nombre de machines virtuelles sous tension si vous avez dfini une limite suprieure pour la taille du slot au moyen des options avances. Ceci parce que quelques machines virtuelles peuvent occuper plusieurs slots. Slots disponibles Nombre de slots disponibles pour mettre sous tension des machines virtuelles supplmentaires dans le cluster. vSphere HA rserve le nombre de slots requis pour le basculement. Les slots restants sont disponibles pour mettre sous tension de nouvelles machines virtuelles. Slots de basculement. Nombre total de slots l'exception des slots utiliss ou des slots disponibles. Nombre total de machines virtuelles sous tension dans le cluster. Nombre total d'htes dans le cluster. Nombre total d'htes en marche dans le cluster. Nombre d'htes qui sont connects, qui ne sont pas en mode maintenance et qui ne prsentent pas d'erreurs vSphere HA.
n n n n
Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources mmoire disponibles. Le premier hte (H1) a 9 Ghz de ressources CPU et 9 Go de mmoire disponibles. Le second (H2) a 9 Ghz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 Ghz de CPU et 6 Go de mmoire disponibles. Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire diffrents. VM1 a besoin de 2 Ghz de ressources CPU et 1 Go de mmoire, tandis que VM2 a besoin de 2 Ghz et 1 Go, VM3 a besoin de 1 Ghz et de 2 Go, VM4 a besoin de 1 Ghz et 1 Go, VM5 a besoin de 1 Ghz et 1 Go. Les dfaillances d'hte tolres par le cluster sont dfinies sur la valeur 1.
18
VMware, Inc.
Figure 2-1. Exemple de contrle d'admission avec des rgles de Dfaillances d'hte tolres par le cluster
VM1 2 Ghz 1 Go
VM2 2 Ghz 1 Go
VM4 1 Ghz 1 Go
VM5 1 Ghz 1 Go
H1 9 Ghz 9 Go 4 slots
H2 9 Ghz 6 Go 3 slots
H3 6 Ghz 6 Go 3 slots
VMware, Inc.
19
vSphere Disponibilit
Dtermine si la Capacit de basculement de CPU actuelle ou la Capacit de basculement mmoire actuelle sont infrieures ou non la Capacit de basculement configure correspondante (spcifie par l'utilisateur). Si c'est le cas, le contrle d'admission n'autorise pas l'opration.
vSphere HA utilise les rserves effectives des machines virtuelles. Si une machine virtuelle n'a pas de rserves, c'est--dire que la valeur de rserve est nulle, les valeurs utilises par dfaut sont 0 Mo de mmoire et 32 MHz de CPU. REMARQUE Les rgles de contrle d'admission Pourcentage de ressources de cluster rserves vrifient galement qu'il existe au moins deux htes compatibles vSphere HA dans le cluster ( l'exception des htes qui passent en mode maintenance). S'il n'y a qu'un hte compatible vSphere HA, aucune opration n'est autorise, mme si le pourcentage de ressources disponibles est suffisant. Cette vrification supplmentaire s'explique par le fait que vSphere HA ne peut pas effectuer de basculement s'il n'y a qu'un seul hte dans le cluster.
Le besoin en composant CPU est obtenu en additionnant le CPU rserv par les machines virtuelles sous tension. Si aucun CPU n'a t rserv pour une machine virtuelle, une valeur de 32 MHz est dfinie par dfaut (cette valeur peut tre modifie par l'attribut avanc das.vmcpuminmhz). La taille du composant de mmoire est obtenue en additionnant la mmoire rserve (plus la capacit supplmentaire de mmoire) de chaque machine virtuelle sous tension.
Les ressources totales des htes disponibles pour les machines virtuelles sont calcules en additionnant les ressources de CPU et de mmoire des htes. Ces valeurs sont celles contenues dans le pool de ressources racine de l'hte, et non dans les ressources physiques totales de l'hte. Les ressources utilises des fins de virtualisation ne sont pas incluses. Seuls les htes qui sont connects, qui ne sont pas en mode maintenance et qui ne prsentent pas d'erreurs vSphere HA sont pris en compte. La Capacit CPU de basculement actuelle est calcule en soustrayant les besoins totaux en ressources CPU des ressources CPU totales des htes et en divisant le rsultat par les ressources CPU totales des htes. La Capacit mmoire de basculement actuelle est calcule de la mme manire.
Le cluster est compos de trois htes, ayant chacun des quantits diffrentes de CPU et de ressources mmoire disponibles. Le premier hte (H1) a 9 Ghz de ressources CPU et 9 Go de mmoire disponibles. Le second (H2) a 9 Ghz de CPU et 6 Go de mmoire disponibles et le troisime (H3) a 6 Ghz de CPU et 6 Go de mmoire disponibles. Il y a cinq machines virtuelles sous tension dans le cluster avec des besoins en CPU et en mmoire diffrents. VM1 a besoin de 2 Ghz de ressources CPU et 1 Go de mmoire, tandis que VM2 a besoin de 2 Ghz et 1 Go, VM3 a besoin de 1 Ghz et de 2 Go, VM4 a besoin de 1 Ghz et 1 Go, VM5 a besoin de 1 Ghz et 1 Go. La Capacit de basculement configure est de 25 %.
20
VMware, Inc.
Figure 2-2. Exemple de contrle d'admission utilisant les rgles de Pourcentage de ressources de cluster rserves
VM1 2 Ghz 1 Go
VM2 2 Ghz 1 Go
VM3 1 Ghz 2 Go
VM4 1 Ghz 1 Go
VM5 1 Ghz 1 Go
Vert. L'hte est connect, il n'est pas en mode maintenance et ne prsente pas d'erreurs vSphere HA. Aucune machine virtuelle sous tension ne rside sur l'hte. Jaune. L'hte est connect, il n'est pas en mode maintenance et ne prsente pas d'erreurs vSphere HA. Mais des machines virtuelles sous tension rsident sur l'hte. Rouge. L'hte est dconnect, il est en mode maintenance ou prsente des erreurs vSphere HA.
VMware, Inc.
21
vSphere Disponibilit
Tous les htes doivent disposer d'une licence pour vSphere HA. REMARQUE Les htes ESX/ESXi 3.5 sont pris en charge par vSphere HA mais doivent inclure un correctif afin de traiter un problme impliquant le verrouillage de fichiers. Vous devez appliquer le correctif ESX350-201012401-SG pour les htes ESX 3.5, et le correctif ESXe350-201012401-I-BG pour les htes ESXi 3.5. D'autres correctifs doivent tre appliqus pralablement ces correctifs.
22
VMware, Inc.
n n
Le cluster doit contenir deux htes au minimum. Tous les htes doivent tre configurs avec des adresses IP statiques. Si vous utilisez DHCP, vrifiez que l'adresse de chaque hte est conserve aprs les redmarrages. Il doit y avoir au moins un rseau de gestion commun parmi tous les htes mais il est recommand d'en avoir au moins deux. Les rseaux de gestion diffrent selon la version de l'hte que vous utilisez.
n n n
Htes ESX - rseau de la console du service. Htes ESXi antrieurs la version 4.0 - Rseau VMkernel. Htes ESXi version 4.0 et ultrieure - Rseau VMkernel avec case [Rseau de gestion] coche.
Pour vous assurer que toutes les machines virtuelles peuvent tre excutes sur n'importe quel hte du cluster, tous les htes doivent avoir accs aux mme rseaux et banques de sonnes de machines virtuelles. De mme, les machines virtuelles doivent se trouver sur des stockages partags, et non locaux, sinon il ne peut pas y avoir de basculement en cas de dfaillance de l'hte. REMARQUE vSphere HA utilise le signal de pulsation de banque de donnes pour diffrencier les htes partitionns, isols ou dfaillants. En consquence, vous devez vous assurer que les banques de donnes rserves vSphere HA sont toujours disponibles.
Le fonctionnement de surveillance des machines virtuelles ncessite l'installation des outils VMware. Reportez-vous la section Surveillance des VM et applications , page 27. La vrification du certificat de l'hte doit tre active. Reportez-vous la section Activer la vrification du certificat de l'hte , page 44. vSphere HA prend en charge IPv4 et IPv6. Un cluster utilisant la fois ces deux versions de protocole est cependant plus susceptible d'entraner une partition de rseau.
VMware, Inc.
23
vSphere Disponibilit
tat de surveillance d'hte Contrle d'admission Options de machine virtuelle Surveillance de VM Signal de pulsation des banques de donnes
24
VMware, Inc.
Dmarrer vSphere HA
Surveillance d'hte
Aprs avoir cr un cluster, la surveillance d'hte permet l'hte matre vSphere HA de rpondre aux dfaillances de l'hte ou de la machine virtuelle et l'isolation du rseau de gestion. Quand [Activer la surveillance de l'hte] est slectionn, chaque hte du cluster est surveill pour s'assurer de son bon fonctionnement. En cas de dfaillance d'un hte, les machines virtuelles sont redmarres sur un autre hte. La surveillance d'hte est aussi requise pour le bon fonctionnement du processus de rcupration vSphere Fault Tolerance. REMARQUE Si vous devez effectuer des oprations de maintenance rseau risquant de dclencher des ractions d'isolation des htes, VMware vous recommande d'interrompre pralablement vSphere HA en dsactivant la surveillance d'hte. Lorsque la maintenance est termine, activez nouveau la surveillance d'hte.
Dsactive le contrle d'admission Les machines virtuelles peuvent, par exemple, tre mises sous tension mme si cela aboutit une capacit de basculement insuffisante. Lorsque vous faites cela, aucun avertissement n'est prsent et le cluster ne devient pas rouge. Si un cluster a une capacit de
VMware, Inc.
25
vSphere Disponibilit
basculement insuffisante, vSphere HA peut continuer effectuer des basculements et utilise le paramtre de priorit de redmarrage de la machine virtuelle pour prciser quelles machines virtuelles doivent tre mises sous tension les premires. vSphere HA prvoit trois rgles d'application du contrle d'admission en cas d'activation.
n n n
Pannes d'hte que le cluster tolre Pourcentage des ressources de cluster rserves en tant que capacit de basculement de secours Dfinir les htes de basculement
REMARQUE Reportez-vous la section Choisir une rgle de contrle d'admission , page 22 pour plus d'informations sur le fonctionnement du contrle d'admission vSphere HA.
Haute. Serveurs de base de donnes qui fournissent des donnes aux applications. Moyenne. Serveurs d'application qui exploitent les donnes de la base de donnes et fournissent des rsultats sur des pages web. Basse. Serveurs Web qui reoivent des demandes d'utilisateurs, transmettent des requtes des serveurs d'application et transmettent les rsultats aux utilisateurs.
26
VMware, Inc.
VMware, Inc.
27
vSphere Disponibilit
Il arrive qu'occasionnellement, les machines virtuelles ou les applications qui continuent fonctionner correctement, cessent d'mettre des signaux de pulsation. Pour viter les rinitialisations inutiles, le service Surveillance de VM surveille aussi l'activit des E/S d'une machine virtuelle. Si aucun signal de pulsation n'est reu pendant la priode de dfaillance, la frquence des statistiques des E/S (attribut dfini au niveau du cluster) est vrifie. La frquence des statistiques des E/S dtermine si un disque ou une activit rseau s'est produite sur la machine virtuelle au cours des deux minutes (120 secondes) prcdentes. Si ce n'est pas le cas, la machine virtuelle est rinitialise. Cette valeur par dfaut (120 secondes) peut tre modifie l'aide de l'attribut avanc das.iostatsinterval. Pour activer la surveillance d'application, il faut d'abord obtenir le SDK appropri (ou utiliser une application qui prend en charge la surveillance de l'application VMware) et l'utiliser pour configurer des signaux de pulsation personnaliss pour les applications surveiller. Aprs avoir fait cela, la surveillance d'application fonctionne de la mme manire que la Surveillance de VM. Si les signaux de pulsation d'une application ne sont pas reus pendant un certain temps, sa machine virtuelle est redmarre. Vous pouvez configurer le niveau de sensibilit de la surveillance. Une sensibilit de surveillance leve permet de conclure plus rapidement un dysfonctionnement. Mme si cela est peu probable, une sensibilit de surveillance leve peut entraner l'identification errone de dysfonctionnements alors que la machine virtuelle ou l'application en question fonctionne toujours mais les signaux de pulsation ne sont pas reus du fait de certains facteurs tels que des contraintes de ressources. Une sensibilit de surveillance basse se traduit par des interruptions de service prolonges entre les dfaillances avres et le redmarrage des machines virtuelles. Slectionnez l'option qui offre un compromis intressant par rapport vos besoins. Les paramtres par dfaut de la sensibilit de surveillance sont dcrits dans Tableau 2-1. Vous pouvez aussi indiquer des valeurs personnalises la fois pour la sensibilit de la surveillance et les intervalles de statistiques d'E/S en cochant la case [Personnalis] . Tableau 2-1. Paramtres de surveillance des machines virtuelles
Paramtre Haut Moyen Faible Intervalle de dfaillance (en secondes) 30 60 120 Priode de rinitialisation 1 heure 24 heures 7 jours
Lorsque des dysfonctionnements sont dtects, vSphere HA rinitialise les machines virtuelles. La rinitialisation contribue garantir que les services restent disponibles. Pour viter de rinitialiser constamment des machines virtuelles en cas d'erreurs non transitoires, les machines virtuelles sont rinitialises par dfaut trois fois seulement au cours d'une priode configurable. Aprs trois rinitialisations des machines virtuelles, vSphere HA n'effectue aucune tentative supplmentaire pour redmarrer les machines virtuelles en cas de nouvel chec et ce jusqu' ce que la priode dfinie ne soit coule. Vous pouvez configurer le nombre de rinitialisations l'aide du paramtre personnalis [Nbre maximum de rinitialisations par machine virtuelle] .
28
VMware, Inc.
das.usedefaultisolationaddress
das.isolationshutdowntimeout
das.slotmeminmb
das.slotcpuinmhz
VMware, Inc.
29
vSphere Disponibilit
das.vmcpuminmhz
das.iostatsinterval
das.ignoreinsufficienthbdatastore
das.heartbeatdsperhost
REMARQUE Si vous modifiez la valeur de l'un des attributs avancs suivants, vous devez dsactiver, puis ractiver vSphere HA avant que les modifications ne s'appliquent.
n n n
das.consoleUser das.consoleNode das.consolePerm das.primaryCount das.checkVmStateDelay das.trace das.traceLevel das.traceOutput das.preferredPrimaries das.disableUWSwapRequirement das.sensorPollingFreq das.bypassNetCompatCheck
30
VMware, Inc.
n n n
Si vous tentez de dfinir une des options non prises en charge, vCenter Server 5.0 signale que l'option n'est pas valide. De mme, si vous effectuez une mise niveau de vCenter Server 5.0 partir d'une version prcdente avec une de ces options dfinies, elles sont supprimes et ne sont plus utilisables.
Le comportement de la machine virtuelle est dsormais diffrent des rglages par dfaut du cluster pour chaque paramtre modifi.
Ressources de basculement insuffisantes (alarme de cluster) Impossible de trouver le cluster principal (une alarme de cluster) Basculement en cours (une alarme de cluster) Statut HA de l'hte (une alarme d'hte) Erreur de surveillance VM (une alarme de machine virtuelle) Action de surveillance de VM (alarme de machine virtuelle)
VMware, Inc.
31
vSphere Disponibilit
REMARQUE Les alarmes par dfaut contiennent le nom de la fonction, vSphere HA.
Slectionnez les rgles de contrle d'admission Pourcentage de ressources de cluster rserves. Ces rgles offrent la plus grande flexibilit en termes de dimensionnement d'htes et de machines virtuelles. Dans la plupart des cas, le calcul 1/N, o N est le nombre total de nuds dans le cluster, dtermine la quantit qui convient. Assurez-vous d'attribuer la mme taille tous les htes du cluster. Si un cluster est dsquilibr, une capacit excessive est rserve au traitement des dfaillances du plus grand nud possible. Faites en sorte que les spcifications de dimensionnement des machines virtuelles soient similaires parmi toutes les machines virtuelles configures. Les rgles de contrle d'admission Dfaillances d'hte tolres par le cluster utilisent la taille de slot pour calculer la capacit qui doit tre rserve chaque machine virtuelle. La taille de slot repose sur la plus grande mmoire et CPU rserves ncessaires une machine virtuelle. Lorsque vous mlangez des machines virtuelles ayant des spcifications de CPU et de mmoire diffrentes, le calcul dtermine la plus grande taille de slot possible, ce qui limite la consolidation.
32
VMware, Inc.
Interruption de vSphere HA
Si vous devez effectuer des oprations de maintenance rseau risquant de dclencher des ractions d'isolation des htes, VMware vous recommande d'interrompre pralablement vSphere HA en dsactivant la surveillance d'hte. Lorsque la maintenance est termine, activez nouveau la surveillance d'hte.
En cas de modification des rseaux sur lesquels se trouvent les htes ESXi en clusters, VMware recommande de suspendre la fonction de surveillance d'hte. Les changements de matriel ou de paramtres rseau peuvent interrompre les signaux de pulsation utiliss par vSphere HA pour dtecter les dfaillances d'htes, ce qui risque d'entraner des tentatives intempestives de basculement des machines virtuelles. Lorsque vous modifiez la configuration rseau directement sur les htes ESXi, par exemple, pour ajouter des groupes de ports ou pour supprimer des vSwitches, VMware recommande non seulement de suspendre la surveillance de ces htes mais galement de les placer en mode maintenance. Lorsque l'hte quitte le mode maintenance, il est reconfigur, ce qui provoque un nouvel examen des informations rseau de l'hte en cours d'excution. S'il n'a pas t plac en mode maintenance, l'agent vSphere HA s'excute en utilisant les anciennes informations de configuration rseau.
REMARQUE La mise en rseau tant un aspect essentiel de vSphere HA, l'administrateur de vSphere HA doit tre tenu inform de toute opration de maintenance du rseau.
Sur les htes hrits ESX du cluster, les communications vSphere HA sont achemines via tous les rseaux qui sont identifis comme rseaux de console de service. Les rseaux VMkernel ne sont pas utiliss par ces htes pour les communications vSphere HA.
VMware, Inc.
33
vSphere Disponibilit
Sur les htes ESXi du cluster, les communications vSphere HA sont achemines par dfaut via les rseaux VMkernel, sauf ceux spcifiques vMotion. S'il n'existe qu'un seul rseau VMkernel, vSphere HA le partage avec vMotion, si ncessaire. Avec ESXi 4.x et ESXi, il faut aussi cocher explicitement la case [Trafic de gestion] si vSphere HA doit utiliser ce rseau.
REMARQUE Pour maintenir le trafic de gestion de lagent vSphere HA spar de tout autre trafic rseau, VMware vous recommande de configurer les htes de faon ce que les cartes vmkNIC utilises par vSphere HA ne partagent pas les sous-rseaux avec les cartes vmkNIC utilises dautres fins. Les agents vSphere HA envoient des paquets en utilisant une carte pNIC associe un sous-rseau donn sil y a aussi au moins une carte vmkNIC configure pour le trafic de gestion vSphere HA. Par consquent, pour assurer la sparation de flux rseau, les cartes vmkNIC utiliss par vSphere HA et par les autres fonctionnalits doivent tre sur des sousrseaux diffrents.
Configuration des commutateurs. Si les commutateurs rseau physiques qui relient les serveurs prennent en charge le paramtre PortFast (ou quivalent), activez-le. Ce paramtre empche un hte de se tromper en dterminant qu'un rseau est isol au cours de l'excution de longs algorithmes STA. Noms de groupes de ports et tiquettes rseau. Utilisez des noms de groupes de ports cohrents et des tiquettes rseau sur les VLAN des rseaux publics. Les noms de groupes de ports permettent de reconfigurer l'accs au rseau par les machines virtuelles. Si vous utilisez des noms incohrents entre le serveur d'origine et le serveur de basculement, les machines virtuelles sont dconnectes de leur rseau aprs le basculement. Les tiquettes rseau sont utilises par les machines virtuelles pour rtablir la connectivit rseau au redmarrage. Configurez les rseaux de gestion de sorte que l'agent vSphere HA prsent sur un hte du cluster puisse associer les agents de n'importe quel autre hte via l'un des rseaux de gestion. Si votre configuration ne respecte pas cela, une partition de rseau peut survenir aprs le choix d'un hte principal.
34
VMware, Inc.
Il est possible d'implmenter la redondance du rseau au niveau de l'association de adaptateurs rseau, ou au niveau rseau de gestion. Dans la plupart des implmentations, l'association des adaptateurs rseau offre une redondance suffisante, mais il est possible d'utiliser ou d'ajouter au besoin la redondance de rseau de gestion. La mise en rseau de gestion redondante garantit la fiabilit de la dtection des pannes et vite la ralisation de conditions d'isolation car les signaux de pulsation peuvent tre transmis via plusieurs rseaux. Configurez un nombre aussi rduit que possible de segments matriels entre les serveurs d'un cluster. L'objectif est de limiter les points de panne isols. De plus, les chemins contenant trop de bonds peuvent provoquer des retards de paquets de signaux de pulsation et augmenter les points de panne ventuels.
quilibrage de charge par dfaut = Router en fonction de l'ID du port d'origine Retour arrire = Non
Lorsque vous avez ajout une carte rseau un hte de votre cluster vSphere HA, vous devez reconfigurer vSphere HA sur cet hte.
VMware, Inc.
35
vSphere Disponibilit
36
VMware, Inc.
Il est possible d'activer vSphere Fault Tolerance pour les machines virtuelles afin d'assurer la continuit d'activit avec des niveaux de disponibilit et de protection des donnes suprieurs ceux offerts par vSphere HA. Fault Tolerance est intgre la plate-forme hte ESXi (par la technologie VMware vLockstep) et elle assure la continuit de la disponibilit en excutant des machines virtuelles identiques en mode rigide virtuel sur des htes distincts. Pour obtenir des rsultats optimaux de Fault Tolerance, il est ncessaire d'en comprendre le fonctionnement, de savoir comment l'activer sur un cluster et sur des machines virtuelles, et de connatre les meilleures pratiques pour son utilisation. REMARQUE Vous verrez parfois apparatre des messages d'erreur quand vous tenterez d'utiliser Fault Tolerance. Pour plus d'informations sur les messages d'erreur lis Fault Tolerance, consultez l'article de la base de connaissances VMware sur http://kb.vmware.com/kb/1033634. Ce chapitre aborde les rubriques suivantes :
n n n n n n n n n n
Fonctionnement de Fault Tolerance , page 38 Utiliser Fault Tolerance avec DRS , page 39 Cas d'utilisation de Fault Tolerance , page 39 Liste de vrification de Fault Tolerance , page 40 Interoprabilit de Fault Tolerance , page 42 Prparer votre cluster et vos htes Fault Tolerance , page 43 Assurer Fault Tolerance des machines virtuelles , page 47 Afficher des informations sur les machines virtuelles tolrantes aux pannes , page 49 Pratiques d'excellence pour Fault Tolerance , page 51 Recommandations de configuration de vSphere Fault Tolerance , page 53
VMware, Inc.
37
vSphere Disponibilit
secondaire
applications
systme d'exploitation client systme
journalisation du trafic
VMware
VMware
client ENREGISTREMENT
vnements non dterministes Entre (rseau, utilisateur), E/S asynchrone (disque, priphriques) temporisateur CPU vnements
RPTITION
vnements non dterministes Rsultat = reproductible excution de la machine virtuelle
Les machines virtuelles principale et secondaire changent des signaux de pulsation en continu. Cet change permet la paire de machines virtuelles de contrler mutuellement leur tat pour assurer le maintien permanent de Fault Tolerance. Un basculement transparent se produit en cas de dfaillance de l'hte sur lequel la machine virtuelle principale est excute. Dans ce cas, la machine virtuelle secondaire est immdiatement active pour remplacer la machine virtuelle principale. Une nouvelle machine virtuelle secondaire dmarre et la redondance de Fault Tolerance est rtablie en quelques secondes. Si l'hte de la machine virtuelle secondaire devient dfectueux, il est aussi immdiatement remplac. Dans l'un ou l'autre cas, les utilisateurs ne constatent aucune interruption de service ni perte de donnes. Une machine virtuelle tolrante aux pannes et sa copie secondaire ne sont pas autorises fonctionner sur le mme hte. Cette restriction garantit qu'une dfaillance de l'hte ne peut pas entraner la perte des deux machines virtuelles. Vous pouvez aussi utiliser les rgles d'affinit entre machine virtuelle et hte pour prciser les htes sur lesquels certaines machines virtuelles peuvent tre excutes. Si vous utilisez ces rgles, souvenezvous que pour chaque machine virtuelle principale affecte par une rgle prcise, la machine virtuelle secondaire qui y est associe est aussi affecte par la mme rgle. Pour plus d'informations sur les rgles d'affinit, reportez-vous la documentation Gestion des ressources vSphere.
38
VMware, Inc.
Fault Tolerance vite les situations de division qui peuvent se traduire par deux copies actives d'une machine virtuelle aprs la reprise suite un dysfonctionnement. Le verrouillage atomique des fichiers sur les stockages partags est utilis pour coordonner le basculement de faon ce qu'un ct seulement continue excuter la machine virtuelle principale et une nouvelle machine virtuelle secondaire est automatiquement raffecte. REMARQUE Le contrle anti-affinit est effectu la mise sous tension de la machine virtuelle principale. Les machines virtuelles principales et secondaires peuvent tre sur les mme htes lorsqu'elles sont toutes deux hors tension. C'est un comportement normal. Quand la machine virtuelle principale s'allume, la machine virtuelle secondaire est dmarre sur un hte diffrent.
Les applications qui doivent tre disponibles en permanence, surtout celles prsentant des connexions longues dures de clients que les utilisateurs veulent conserver pendant la dfaillance matrielle. Applications personnalises qui n'ont pas d'autres moyens de former un cluster.
VMware, Inc.
39
vSphere Disponibilit
Cas o la grande disponibilit peut tre assure par des solutions de formation de cluster personnalises qui sont trs compliques configurer et entretenir.
Vrification du certificat de l'hte active. Reportez-vous la section Activer la vrification du certificat de l'hte , page 44. Deux htes certifis FT au minimum utilisant la mme version de Fault Tolerance ou le mme numro de compilation d'hte. Le numro de version de Fault Tolerance apparat sur l'onglet [Rsum] d'un hte dans le vSphere Client. REMARQUE Pour les htes hrits antrieurs ESX/ESXi 4.1, cet onglet numre les numros de version des htes. Les correctifs peuvent provoquer une variation des numros de compilation d'hte entre les installations ESX et ESXi. Pour vous assurer que vos htes hrits sont compatibles avec FT, ne mlangez pas les htes hrits ESX et les htes ESXi dans une paire FT.
Les htes ESXi ont accs aux mmes banques de donnes et rseaux des machines virtuelles. Reportezvous la section Pratiques d'excellence pour Fault Tolerance , page 51. Journalisation de Fault Tolerance et rseau vMotion configur. Reportez-vous la section Configurer la mise en rseau des machines htes , page 44. Cluster vSphere HA cr et activ. Reportez-vous la section Crer un cluster vSphere HA , page 23. vSphere HA doit tre activ avant la mise sous tension des machines virtuelles tolrantes aux pannes ou avant l'ajout d'un hte dans un cluster qui prend dj en charge des machines virtuelles tolrantes aux pannes.
40
VMware, Inc.
Les htes doivent avoir des processeurs appartenant au groupe de processeurs compatibles avec FT. Il est galement fortement recommand que les processeurs des htes soient compatibles entre eux. Consultez l'article de la base de connaissances de VMware sur http://kb.vmware.com/kb/1008027 pour obtenir des informations sur les processeurs pris en charge. Les htes doivent avoir une licence pour Fault Tolerance. Les htes doivent tre certifis pour Fault Tolerance. Reportez-vous la section http://www.vmware.com/resources/compatibility/search.php et slectionnez [Recherche par jeux comptatibles tolrants aux pannes] pour dterminer si vos htes sont certifis. La configuration de chaque hte implique l'activation de la virtualisation matrielle (HV) dans le BIOS.
n n
Pour confirmer la compatibilit des htes du cluster pour la prise en charge de Fault Tolerance, vous pouvez aussi effectuer des vrifications de conformit de profils comme dcrit dans Crer un cluster vSphere HA et en vrifier la conformit , page 47. REMARQUE Quand un hte ne peut pas prendre en charge Fault Tolerance, vous pouvez en consulter les raisons sur l'onglet [Rsum] de l'hte dans vSphere Client. Cliquez sur l'icne de lgende bleue ct du champ [Hte configur pour FT] et une liste des conditions de Fault Tolerance que l'hte ne satisfait pas s'affiche.
Aucun priphrique non pris en charge n'est attach la machine virtuelle. Reportez-vous la section Interoprabilit de Fault Tolerance , page 42. Les machines virtuelles doivent tre conserves dans des fichiers de RDM virtuel ou de disque de machine virtuelle (VMDK) qui sont approvisionns en lourd. Lorsqu'une machine virtuelle est conserve dans un fichier VMDK qui est approvisionn en allg et que vous tentez d'activer Fault Tolerance, un message vous avertit que le fichier VMDK doit tre converti. Vous devez mettre hors tension la machine virtuelle pour excuter la conversion. Les fonctions incompatibles ne doivent pas tre excutes avec les machines virtuelles tolrantes aux pannes. Reportez-vous la section Interoprabilit de Fault Tolerance , page 42. Les fichiers de machines virtuelles doivent tre conservs dans un stockage partag. Les solutions de stockage partag approuves comprennent Fibre Channel, iSCSI (matriel et logiciel), NFS et NAS. Seules les machines virtuelles avec un seul vCPU sont compatibles avec Fault Tolerance. Les machines virtuelles doivent tre excutes sur l'un des systmes d'exploitation clients pris en charge. Consultez l'article de la base de connaissances de VMware sur http://kb.vmware.com/kb/1008027 pour plus d'informations.
n n
VMware, Inc.
41
vSphere Disponibilit
Snapshots. Les snapshots doivent tre supprims ou engags avant l'activation de Fault Tolerance sur une machine virtuelle. De plus, il n'est pas possible de prendre des snapshots de machines virtuelles sur lesquelles Fault Tolerance est active. Stockage vMotion Il n'est pas possible d'appeler le stockage vMotion pour les machines virtuelles pour lesquelles Fault Tolerance est active. Pour migrer le stockage, il faut mettre hors tension temporairement Fault Tolerance et excuter l'action de stockage vMotion. Une fois ceci fait, vous pouvez ractiver Fault Tolerance. Clones lis. Il n'est pas possible d'activer Fault Tolerance sur une machine virtuelle qui est lie un clone et il n'est pas non plus possible de crer un clone li partir d'une machine virtuelle dont Fault Tolerance est active. Sauvegardes des machines virtuelles. Il n'est pas possible de sauvegarder une machine virtuelle ayant la FT active et utilisant vStorage API for Data Protection, VMware Data Recovery ou tout autre produit de sauvegarde similaire exigeant l'utilisation d'un snapshot de machine virtuelle, comme effectu par ESXi. Pour sauvegarder une machine virtuelle tolrante aux pannes de cette faon, il faut pralablement dsactiver la tolrance aux pannes, puis la ractiver aprs la sauvegarde. Les snapshots de stockage bass sur une baie n'affectent pas la tolrance aux pannes.
Lecteur de CD-ROM ou de disquettes virtuels pris en charge par un priphrique physique ou distant. Clients paravirtualiss. Priphrique USB et audio. Virtualisation d'identification N-Port (NPIV). relais de adaptateurs rseau Pilotes rseau vlance.
42
VMware, Inc.
Tableau 3-1. Fonctions et priphriques incompatibles avec Fault Tolerance et les actions correctives (suite)
Fonction ou priphrique incompatible Disques virtuels pris en charge par des disques de provisionnement lourds ou lgers dont les fonctions de cluster ne sont pas actives. Connexion de priphriques chaud Action corrective Lorsque vous activez Fault Tolerance, la conversion au format de disque appropri est effectue par dfaut. Vous devez mettre hors tension la machine virtuelle pour dclencher cette conversion. La fonction de connexion chaud est automatiquement dsactive pour les machines virtuelles tolrantes aux pannes. Pour la connexion des priphriques chaud (ajout ou suppression), vous devez mettre hors tension temporairement Fault Tolerance, effectuer la connexion chaud, puis ractiver Fault Tolerance. REMARQUE Lorsque vous utilisez Fault Tolerance, la modification des paramtres d'une carte rseau virtuelle pendant le fonctionnement d'une machine virtuelle constitue une connexion chaud, car cela exige de dbrancher la carte rseau, puis de la rebrancher . Prenons l'exemple d'une carte rseau virtuelle pour une machine virtuelle en cours d'excution. Si vous modifiez le rseau auquel la carte rseau virtuelle est connecte, la tolrance aux pannes doit pralablement tre arrte. EPT/RVI est automatiquement dsactiv pour les machines virtuelles pour lesquelles Fault Tolerance est active. Dconnectez ces priphriques de la machine virtuelle. Utilisez les adresses IPv4 avec la carte rseau de journalisation FT. Fault Tolerance ne prend pas en charge les priphriques vido dont la 3D est active.
Extended Page Tables/Rapid Virtualization Indexing (EPT/RVI). Ports srie ou parallles IPv6 Priphriques vido dont la 3D est active.
Activer la vrification du certificat de l'hte (s'il s'agit d'une mise niveau d'une ancienne version de vCenter Server) Configurer la mise en rseau de chaque hte Crer un cluster vSphere HA, ajouter des htes et vrifier la conformit
n n
Lorsque le cluster et les htes sont prts, vous pouvez activer Fault Tolerance pour vos machines virtuelles. Reportez-vous la section Activer Fault Tolerance pour des machines virtuelles , page 49.
VMware, Inc.
43
vSphere Disponibilit
44
VMware, Inc.
7 8 9
Slectionnez [Utiliser ce groupe de ports pour vMotion] ou [Utiliser ce groupe de ports pour la journalisation de Fault Tolerance] puis cliquez sur [Suivant] . Indiquez une adresse IP et un masque de sous-rseau et cliquez sur [Suivant] . Cliquez sur [Terminer] .
Lorsque vous avez cr la fois un commutateur virtuel de journalisation vMotion et de Fault Tolerance, vous pouvez crer d'autres commutateurs virtuels en cas de besoin. Ajoutez ensuite l'hte au cluster et suivez les tapes ncessaires l'activation de Fault Tolerance. Suivant Pour confirmer la russite de l'activation de vMotion et de Fault Tolerance sur l'hte, consultez l'onglet [Rsum] correspondant dans le vSphere Client. Dans le volet Gnral, les champs [vMotion activ] et [Hte configur pour FT] doivent tre dfinis sur oui. REMARQUE Si vous configurez la mise en rseau pour la prise en charge de Fault Tolerance mais que vous dsactivez ensuite le port de journalisation de Fault Tolerance, les paires de machines virtuelles Fault Tolerance qui sont dj sous tension le restent. Mais en cas de situation de basculement surgit, une nouvelle machine virtuelle secondaire n'est pas dmarre aprs le remplacement de la machine virtuelle principale par sa machine virtuelle secondaire. Par consquent, la nouvelle machine virtuelle principale fonctionne en tant non protge.
Rpartissez chaque association de adaptateurs rseau sur deux commutateurs physiques assurant la continuit des domaines L2 pour chaque VLAN entre les deux commutateurs physiques. Utilisez des rgles d'association dterministe pour vous assurer que des types de trafic particuliers prsentent une affinit avec une carte rseau particulire (active/veille) ou un ensemble de adaptateurs rseau (par exemple, ID port virtuel d'origine). Quand des rgles active/veille sont utilises, associez les types de trafic pour rduire les rpercussions dans le cas de basculement o les deux types de trafic partagent un vmnic.
VMware, Inc.
45
vSphere Disponibilit
Quand des rgles active/veille sont utilises, configurez tous les adaptateurs actifs pour un type de trafic particulier (par exemple, journalisation de la tolrance aux pannes) sur le mme commutateur physique. Cela rduit le nombre de bonds rseau et diminue les possibilits de surabonner le commutateur des liaisons de commutateurs.
Exemple de configuration avec quatre cartes NIC de 1 Go Figure 3-2 dcrit la configuration du rseau pour un seul hte ESXi avec quatre cartes NIC de 1 Go prenant en charge Fault Tolerance. Les autres htes du cluster FT seraient configurs de la mme manire. Cet exemple utilise quatre groupes de ports configurs comme suit :
n
VLAN A : Port rseau des machines virtuelles actif au niveau du groupe sur vmnic2 (vers le commutateur physique #1) ; en veille sur vmnic0 (vers le commutateur physique #2.) VLAN B : Port rseau de gestion actif au niveau du groupe sur vmnic0 (vers le commutateur physique #2) ; en veille sur vmnic2 (vers le commutateur physique #1.) VLAN C : Port de vMotion actif au niveau du groupe sur vmnic1 (vers le commutateur physique #2) ; en veille sur vmnic3 (vers le commutateur physique #1.) VLAN D : Port de journalisation FT actif au niveau du groupe sur vmnic3 (vers le commutateur physique #1) ; en veille sur vmnic1 (vers le commutateur physique #2.)
La journalisation vMotion et FT peut partager le mme VLAN (configurez le mme nombre de VLAN dans les deux groupes de ports), mais exige que leurs propres adresses IP uniques rsident dans diffrents sousrseaux IP. Toutefois, des VLAN spars peuvent tre prfrs si des restrictions de qualit de service (QoS) sont en vigueur sur le rseau physique avec des rgles de QoS bases sur VLAN. QoS est particulirement utilise lorsque le trafic concurrent intervient, par exemple, lorsque plusieurs bonds de commutateurs physiques sont utiliss ou quand un basculement a lieu et que plusieurs types de trafic entrent en concurrence pour des ressources rseau. Figure 3-2. Exemple de configuration de mise en rseau pour Fault Tolerance
FT virtuel machine virtuel machine virtuel machine gestion Mise en rseau vmkernel vMotion
VLAN A
VLAN B
VLAN D
VLAN C
vmnic2 Joncteurs rseau VLAN sur des liaisons montantes Ports de commutateur physique configurs comme VLAN joncteurs et porte les VLAN A, B, C et D
vmnic0
vmnic3
vmnic1 vSwitch (vSS or vDS) dans Jonction de commutateur virtuel Mode (VST) balisage VLAN trames transmises liaison montante vers/ partir de vmnics
physique commutateur 1
physique commutateur 2
46
VMware, Inc.
La machine virtuelle rside sur un hte qui n'a pas de licence pour la fonction. La machine virtuelle rside sur un hte qui est en mode maintenance ou standby. La machine virtuelle est dconnecte ou orpheline (son fichier .vmx n'est pas accessible). L'utilisateur n'a pas l'autorisation d'activer la fonction.
Si l'option pour activer Fault Tolerance est disponible, cette tche doit encore tre valide et peut chouer si certaines conditions n'est pas remplies.
Le contrle de certificat SSL doit tre activ dans les paramtres de vCenter Server. L'hte doit se trouver dans un cluster HA vSphere ou un cluster mixte vSphere HA et DRS. L'hte doit avoir ESX/ESXi 4.0 ou ultrieur install. La machine virtuelle ne doit pas avoir plusieurs vCPU. La machine virtuelle ne doit pas avoir de snapshots. La machine virtuelle ne doit pas tre un modle. La machine virtuelle ne doit pas avoir vSphere HA dsactiv. Aucun priphrique vido dont la 3D est active ne doit tre prsent sur la machine virtuelle.
VMware, Inc.
47
vSphere Disponibilit
Plusieurs vrifications de validation supplmentaires sont effectues pour les machines virtuelles sous tension (ou celles qui sont en cours de mise sous tension).
n
Le BIOS des htes o rsident les machines virtuelles tolrantes aux pannes doit avoir la virtualisation matrielle (HV, Hardware Virtualization) active. L'hte qui prend en charge la machine virtuelle principale doit avoir un processeur qui prend en charge Fault Tolerance. L'hte qui prend en charge la machine virtuelle secondaire doit avoir un processeur qui prend en charge Fault Tolerance et dont la famille ou le modle de CPU est le mme que l'hte qui prend en charge la machine virtuelle principale. Les composants matriels doivent tre certifis compatibles avec Fault Tolerance. Pour en avoir la confirmation, consultez le Guide de compatibilit VMware sur http://www.vmware.com/resources/compatibility/search.php et slectionnez [Recherche par ensembles compatibles tolrants aux pannes] . La combinaison du systme de la machine virtuelle d'exploitation invit et le processeur doit tre prise en charge par Fault Tolerance (par exemple, Solaris de 32 bits sur des processeurs AMD n'est pas actuellement pris en charge). Consultez l'article de la base de connaissances de VMware sur http://kb.vmware.com/kb/1008027 pour obtenir des informations sur les combinaisons de processeurs et les systmes d'exploitation clients pris en charge. La configuration de la machine virtuelle doit tre valide pour tre utilise avec une Fault Tolerance (par exemple, la configuration ne peut comporter aucun priphrique non pris en charge.).
Quand votre effort d'activation de Fault Tolerance pour une machine virtuelle russit aux contrles de validation, la machine virtuelle secondaire est cre. Le placement et le statut immdiat de la machine virtuelle secondaire dpendent de l'tat sous tension ou hors tension de la machine virtuelle principale quand vous avez activ Fault Tolerance. Si la machine virtuelle principale est sous tension :
n
L'tat complet de la machine virtuelle principale est copi et la machine virtuelle secondaire est cre, place sur un hte compatible distinct et mise sous tension si elle passe le contrle d'admission. L'tat de Fault Tolerance affich sur l'onglet [Rsum] de la machine virtuelle dans le vSphere Client est [Protg] .
La machine virtuelle secondaire est cre immdiatement et enregistre dans le cluster d'un hte (Il doit tre enregistr sur un hte plus appropri lorsqu'il est mis sous tension.) La machine virtuelle secondaire est mise sous tension seulement aprs la mise sous tension de la machine virtuelle principale. L'tat de Fault Tolerance affich sur l'onglet [Rsum] de la machine virtuelle dans vSphere Client est [Non protg, VM inactive] . Quand vous essayez de mettre sous tension la machine virtuelle primaire aprs l'activation de Fault Tolerance, les contrles supplmentaires de validation sont excuts. Pour mettre sous tension correctement, la machine virtuelle ne doit pas employer la paravirtualisation (VMI). Aprs le passage de ces contrles, les machines virtuelles principales et secondaires sont mises sous tension et places sur les htes distincts et compatibles. L'tat de Fault Tolerance affich sur l'onglet [Rsum] de la machine virtuelle dans le vSphere Client est marqu [Protg] .
48
VMware, Inc.
Afficher des informations sur les machines virtuelles tolrantes aux pannes
Vous pouvez visualiser les machines virtuelles tolrantes aux pannes dans l'inventaire de vCenter Server en utilisant le vSphere Client. REMARQUE Vous ne pouvez pas mettre hors tension Fault Tolerance de la machine virtuelle secondaire. Le volet vSphere Fault Tolerance apparat dans l'onglet [Rsum] pour la machine virtuelle principale et contient des informations sur la machine virtuelle. tat de Fault Tolerance Indique l'tat de Fault Tolerance de la machine virtuelle.
n
Protge. Indique que les machines virtuelles principale et secondaire sont sous tension et fonctionnent comme prvu.
VMware, Inc.
49
vSphere Disponibilit
Non protge. Indique que la machine virtuelle secondaire ne fonctionne pas. Les raisons possibles sont rpertories dans le tableau. Tableau 3-2. Raisons de l'tat non protg de la machine virtuelle principale
Raison de l'tat non protg Dmarrage Description Fault Tolerance est en train de dmarrer la VM secondaire. Ce message n'est visible que pendant une courte dure. La machine virtuelle principale fonctionne sans machine virtuelle secondaire, ainsi la machine virtuelle principale n'est actuellement pas protge. Ceci se produit gnralement quand il n'y a aucun hte compatible dans le cluster disponible pour la machine virtuelle secondaire. Remdiez cette situation en plaant un hte compatible en ligne. S'il existe un hte compatible en ligne dans le cluster, il peut tre ncessaire d'approfondir la recherche. Dans certaines circonstances, la dsactivation de Fault Tolerance puis sa ractivation suffit pour corriger ce problme. Fault Tolerance est actuellement dsactive (aucune machine virtuelle secondaire ne fonctionne). Ceci se produit quand Fault Tolerance est dsactive par l'utilisateur ou quand vCenter Server dsactive Fault Tolerance aprs avoir chou dans la mise sous tension de la machine virtuelle secondaire. Fault Tolerance est active mais la machine virtuelle est hors tension. Mettez sous tension la machine virtuelle pour obtenir l'tat Protg.
VM secondaire ncessaire
Dsactiv
Emplacement secondaire CPU secondaire totale Mmoire secondaire totale Intervalle vLockstep
Affiche l'hte ESXi sur lequel la machine virtuelle secondaire est hberge. Indique l'utilisation du CPU de la machine virtuelle secondaire, exprime en MHz. Indique l'utilisation de la mmoire de la machine virtuelle secondaire, exprime en Mo. Intervalle de temps (en secondes) requis pour que la machine virtuelle secondaire corresponde l'tat d'excution actuel de la machine virtuelle primaire. En gnral, cet intervalle est infrieur une demi-seconde. Aucun tat n'est perdu pendant un basculement, quelle que soit la valeur de l'intervalle vLockstep. Capacit rseau utilise pour envoyer les informations de journalisation de vSphere Fault Tolerance, de l'hte excutant la machine virtuelle principale l'hte excutant la machine virtuelle secondaire.
50
VMware, Inc.
Pour chaque hte configur pour prendre en charge Fault Tolerance, vous pouvez consulter les informations sur ses machines virtuelles tolrantes aux pannes en accdant l'onglet [Rsum] de l'hte dans vSphere Client. La section [Fault Tolerance] de cet onglet affiche le nombre total de machines virtuelles primaires et secondaires rsidant sur l'hte et le nombre de ces machines virtuelles qui sont sous tension. Si l'hte est ESX/ESXi 4.1 ou ultrieur, cette section affiche galement la version de Fault Tolerance excute par l'hte. Autrement, elle mentionne le numro de build de l'hte. Pour que deux htes soient compatibles, ils doivent avoir des numros de version FT identiques ou des numros de compilation d'hte identiques.
Configuration d'hte
Tenez compte des meilleures pratiques suivantes lors de la configuration des htes.
n
Les htes excutant les machines virtuelles principales et secondaires doivent fonctionner des frquences de processeur assez proches sinon la machine virtuelle secondaire risque de redmarrer plus souvent. Les fonctions de gestion de l'alimentation de la plate-forme qui ne sont pas rgles selon la charge de travail (modes de limitation de puissance et de basse frquence pour conomiser de l'nergie, par exemple) peuvent entraner de fortes variations des frquences du processeur. Si des machines virtuelles secondaires sont redmarres rgulirement, dsactivez tous les modes de gestion de l'alimentation sur les htes excutant des machines virtuelles tolrantes aux pannes ou veillez ce que tous les htes soient excuts avec les mme modes de gestion de l'alimentation. Appliquez la mme configuration d'extension de jeux d'instructions (activ ou dsactiv) tous les htes. Le processus d'activation ou de dsactivation des jeux d'instructions varie en fonction du BIOS. Reportezvous la documentation du BIOS de vos htes pour plus d'informations sur la configuration des jeux d'instructions.
Clusters homognes
vSphere Fault Tolerance peut fonctionner dans des clusters contenant des htes non uniformes, mais il est prfrable que les clusters aient des nuds compatibles. Au moment de la construction du cluster, tous les htes doivent tre configurs comme suit :
n n n n n
Processeurs appartenant au mme groupe de processeurs compatibles. Accs commun aux banques de donnes utilises par les machines virtuelles. La mme configuration rseau de machines virtuelles. La mme version d'ESXi. Le mme numro de version de Fault Tolerance (ou numro de compilation d'hte pour les htes antrieurs ESX/ESXi 4.1). Les mmes paramtres de BIOS (gestion de l'alimentation et hyperthreading) pour tous les htes.
Performances
Pour accrotre la bande passante disponible pour le trafic de journalisation entre les machines virtuelles principales et secondaires, utilisez une carte rseau de 10 Gbit et activez l'utilisation des Trames jumbo.
VMware, Inc.
51
vSphere Disponibilit
Stocker les images ISO sur des stockages partags pour un accs permanent
Les images ISO auxquelles accdent les machines virtuelles dont Fault Tolerance est active doivent tre conserves sur des stockages partags accessibles aux deux instances de la machine virtuelle tolrante aux pannes. Si vous utilisez cette configuration, le CD-ROM prsent dans la machine virtuelle continue de fonctionner correctement, mme en cas de basculement. Pour les machines virtuelles dont Fault Tolerance est active, il est possible d'utiliser les images ISO qui sont uniquement accessibles par la machine virtuelle principale. Dans ce cas, la machine virtuelle principale peut accder l'image ISO, mais en cas de basculement, le CD-ROM signale les erreurs comme s'il n'y avait pas de support. Cette situation peut tre tolre si le CD-ROM est utilis pour une opration provisoire et non critique comme une installation.
52
VMware, Inc.
6 7
Rpteztape 1 tape 5 pour autant de paires de machines virtuelles tolrantes aux pannes que les htes mis niveau peuvent en accueillir. Avec vMotion, rpartissez les machines virtuelles tolrantes aux pannes.
En plus des machines virtuelles non tolrantes aux pannes, vous ne devez pas avoir plus de quatre machines virtuelles (principales ou secondaires) tolrantes aux pannes par hte unique. Le nombre de machines virtuelles tolrantes aux pannes que vous pouvez faire tourner en toute scurit sur chaque hte est fonction de la taille et de la charge de travail, variables, de l'hte ESXi et des machines virtuelles. Si vous accdez au stockage partag par NFS, utilisez du matriel NAS ddi avec au moins une carte rseau 1 Gbit pour atteindre les performances rseaux requises pour le bon fonctionnement de Fault Tolerance. Veillez ce qu'un pool de ressources contenant des machines virtuelles tolrantes aux pannes dispose de rserves de mmoire dpassant la capacit de mmoire des machines virtuelles. La rserve de mmoire d'une machine virtuelle tolrante aux pannes est dfinie par la taille de la mmoire de la machine virtuelle lorsque Fault Tolerance est active. Sans cet excdent de pool de ressources, il risque de ne pas y avoir de mmoire disponible comme capacit supplmentaire. Utilisez 16 disques virtuels au maximum par machine virtuelle tolrante aux pannes. Pour assurer la redondance et une protection maximale de Fault Tolerance, il est recommand d'avoir au minimum trois htes par cluster. Dans une situation de basculement, on dispose ainsi d'un hte capable de grer la nouvelle machine virtuelle secondaire qui est cre.
n n
VMware, Inc.
53
vSphere Disponibilit
54
VMware, Inc.
Index
A
adresse d'isolation rseau 33 Architecture vSphere HA 11 Association de adaptateurs rseau 34, 45 attributs avancs, vSphere HA 28 Auto Deploy 31
B
basculement transparent 9, 38
C
calcul de la taille du slot 17 Capacit de basculement actuelle 17, 19 Capacit de basculement configure 17, 19 cas d'utilisation, Fault Tolerance 39 certificats SSL 14 choix de l'hte principal 12 cluster vSphere HA contrle d'admission 16 cration 23, 24, 47 htrognit 22 hte esclave 12 hte principal 12, 13 meilleures pratiques 31 planification 11 Compatibilit amliore de vMotion 39 compte d'utilisateur vpxuser 14 conditions pralables, Fault Tolerance 40 configuration de la mise en rseau, Fault Tolerance 44, 45 configuration des options avances de vSphere HA 29 continuit d'activit 7 contrle d'admission activation 25 rgle 25 types 16 vSphere HA 16 contrles de validation 47 cration d'un cluster vSphere HA 23
das.isolationaddress 29, 33 das.isolationshutdowntimeout 26, 29 das.maxftvmsperhost 39 das.slotcpuinmhz 17, 29 das.slotmeminmb 17, 29 das.usedefaultisolationaddress 29 das.vmcpuminmhz 17, 19, 29 das.vmmemoryminmb 29 Dfaillances d'hte tolres par le cluster 17, 31 Dfinir les htes de basculement 21 dmarrage de vSphere HA 25 Distributed Resource Scheduler (DRS) dmarrage 25 et Fault Tolerance 42 utilisation avec vSphere Fault Tolerance 39 utilisation avec vSphere HA 15 DRS de stockage 31
E
quilibrage de charge 39 tat de Fault Tolerance Dmarrage 49 Dsactiv 49 Machine virtuelle hors fonctionnement 49 VM secondaire ncessaire 49 tiquettes rseau 33 EVC 39 vnements et alarmes, paramtre 31 Extended Page Tables (EPT) 42
F
Fault Tolerance activation 43 cas d'utilisation 39 conditions pralables 40 configuration de la mise en rseau 44, 45 configuration vSphere 40 continuit de la disponibilit 9 contrles de validation 47 CPU secondaire totale 49 dmarrage 49 emplacement secondaire 49 interoprabilit 42 Intervalle vLockstep 49 journalisation 44, 45
D
das.heartbeatdsperhost 14, 29 das.ignoreinsufficienthbdatastore 29 das.iostatsinterval 27, 29
VMware, Inc.
55
vSphere Disponibilit
Largeur de bande de journalisation 49 liste de vrification 40 meilleures pratiques 51 Mmoire secondaire totale 49 messages d'erreurs 37 prsentation 38 recommandations relatives la configuration 53 rgles d'anti-affinit 38 restrictions pour l'activation 47 vrification de conformit 47 version 40 Fault Tolerance la demande 39 fichiers de journalisation 14 Fonction de dmarrage et d'arrt de machine virtuelle 23 fonction de surveillance de l'hte 25, 33 fragmentation des ressources 22
Fault Tolerance 51 Mise en rseau vSphere HA 33 messages d'erreurs Fault Tolerance 37 vSphere HA 11 minimiser les interruptions de service 7 mise niveau d'htes avec des machines virtuelles tolrantes aux pannes 52 Mise en rseau vSphere HA meilleures pratiques 33 Redondance des chemins d'accs 34 modifier les paramtres du cluster 24 multiprocesseur symtrique (SMP) 42
N
Nombre maximum de rinitialisations par machine virtuelle 27 noms des groupes de ports 33
G
Gestion de l'alimentation distribue (DPM) 15, 16
P
paramtre de priorit de redmarrage des machines virtuelles 26 paramtre de rponse l'isolement d'un hte 26 paramtres de cluster 24 paramtres de remplacement des machines virtuelles 26, 31 paravirtualisation 42 partition de rseau 1214, 51 passerelle par dfaut 33 personnalisation de vSphere HA 28 planification d'un cluster vSphere HA 11 port TCP 14 port UDP 14 PortFast 33 ports de pare-feu 14, 33 Pourcentage de ressources de cluster rserves 19 Pourcentage de ressources du cluster rserves 31 protection des machines virtuelles 12, 13 Public cibl 5
H
htes isolation rseau 12 mode maintenance 12, 15 htes de basculement 21 htes de basculement actuels 21
I
images ISO 51 Informations d'excution avances 17 interoprabilit, Fault Tolerance 42 Interruption imprvu 8 prvu 7 interruption de service imprvue 8 interruption de service prvue 7 interruption de vSphere HA 25 intervalles de statistiques d'E/S 27 IPv4 22, 42 IPv6 22, 42, 44
R
Rapid Virtualization Indexing (RVI) 42 RDM 40, 42 recherche de DNS 22 rgle de contrle d'admission choix 22 Dfaillances d'hte tolres par le cluster 17 Dfinir les htes de basculement 21 Pourcentage de ressources de cluster rserves 19 rgles d'affinit 38, 39
J
Journalisation de la tolrance aux pannes 38
M
meilleures pratiques clusters vSphere HA 31
56
VMware, Inc.
Index
rgles d'affinit machine virtuelle/machine virtuelle 21 rgles d'anti-affinit 38 rseau de gestion 22, 33
S
SAN iSCSI 40 sensibilit de surveillance 27 signal de pulsation de banque de donnes 12, 14 slot 17 snapshots 42 Statut oprationnel du cluster 31 stockage iSCSI 40 NAS 40, 53 NFS 40, 53 Storage vMotion 7, 31, 42 Surveillance d'application 12, 27 Surveillance de VM 12, 27 surveillance de vSphere HA 31
T
tolrance des dfaillances d'hte 17
V
validit du cluster 31 vrification de conformit, Fault Tolerance 47 vrification du certificat de l'hte 40, 44 Virtualisation d'identification N-Port (NPIV) 42 Virtualisation matrielle (HV) 40, 47 VLAN 45 VMDK 40 VMFS 14, 33 VMware Tools 27 VMware vLockstep 9, 37, 38 vSphere HA attributs avancs 28 avantages 8 dmarrage 25 interruption 25, 31 liste de vrification 22 messages d'erreurs 11 paramtres de cluster 23 personnalisation 28 reprise d'activit suite une interruption 8 surveillance 31
VMware, Inc.
57
vSphere Disponibilit
58
VMware, Inc.