Ainsi, à l’adresse Stratus , nous sommes et avons été les leaders de l’infrastructure informatique fiable pendant des décennies. Cependant, comme beaucoup de termes dans le domaine de la technologie, la définition de la haute disponibilité (HA) est très large. L’année dernière, une étude réalisée par un cabinet d’analystes très respecté a révélé que la majorité des personnes interrogées pensaient que la haute disponibilité signifiait disposer d’un plan de reprise après sinistre. Et nous avons constaté que la définition change également lorsque vous parlez à des personnes ayant une expérience des différentes plates-formes informatiques (c’est-à-dire que l’ordinateur central et le dev/ops voient cela très différemment). IDC dispose d’un ensemble de niveaux de disponibilité qu’il utilise depuis des années, mais ils semblent un peu larges, car la plupart des technologies existantes entrent dans la catégorie très large des AL3.
Qu’est-ce que la haute disponibilité ? Voici nos définitions regroupées par impact sur l’utilisateur final.
Impact significatif sur l’utilisateur final (généralement mesuré en heures d’arrêt – IDC appelle cela AL1 et AL2)
Sans protection – C’est probablement assez facile à comprendre. Il s’agit d’une charge de travail qui n’a pas de caractéristiques de fiabilité particulières mises en œuvre, que ce soit au niveau de l’application, de l’hyperviseur ou de l’infrastructure. Si elle tombe en panne, c’est qu’elle est en panne.
Sauvegarde – Il s’agit d’une charge de travail qui est périodiquement copiée (ou snapshotée) sur un nœud différent ou sur data center. Il s’agit d’une bonne mesure de conformité et peut aider à récupérer (si vous avez des heures ou plus).
Reprise après sinistre – Il s’agit d’une forme de sauvegarde plus robuste qui est automatisée pour une reprise plus rapide en cas de défaillance majeure (il peut s’agir d’une erreur humaine ou d’une défaillance majeure de data center due aux conditions météorologiques).
Impact minimal sur l’utilisateur final (généralement mesuré en secondes ou minutes de temps d’arrêt – IDC appelle cela AL3)
Haute disponibilité automatisée – Cette fonction est très courante dans le monde virtualisé. En cas de panne, une nouvelle instance de la charge de travail est redéployée sur un nouveau nœud ou sur data center. La fonction HA de VMware est une mise en œuvre courante de cette fonction. Cette fonction a un impact minimal sur l’infrastructure mais entraîne une interruption assez importante pour l’utilisateur et toutes les données en vol sont perdues. Il s’agit d’une bonne solution pour les applications à charge équilibrée et à grande échelle, comme les serveurs web.
Haute disponibilité instantanée – C’est le monde des clusters dans le monde du métal nu ou des instances redondantes et du stockage répliqué dans le monde virtualisé. L’interruption de service est minime (même une sous-seconde dans certains cas). Cependant, toutes les données et/ou transactions en cours de vol sont perdues. Si votre application est sans état mais non équilibrée en charge, c’est une excellente solution.
Zéro impact sur l’utilisateur final (pas de temps d’arrêt – IDC appelle cela AL4)
Tolérance aux pannes – Il s’agit d’une capacité qui n’était autrefois connue que dans le monde des gros ordinateurs et des mini-ordinateurs. Toutefois, Stratus propose des solutions matérielles, logicielles et cloud qui offrent ce niveau de protection aux systèmes d’exploitation et aux hyperviseurs prêts à l’emploi à un prix comparable à celui des niveaux de protection inférieurs. La tolérance aux pannes est une redondance complète de la charge de travail qui partage également les données en vol et l’état de l’application. Cela signifie qu’il y a un fonctionnement continu et ininterrompu même en cas de panne.
Tolérance aux pannes multi-sites – Il s’agit du plus haut niveau de protection qu’une charge de travail puisse obtenir. Il offre une tolérance aux pannes, de sorte qu’il n’y a pas de perte d’état ou de données, mais les charges de travail redondantes sont hébergées sur des sites différents. Naturellement, ce type de solution entraîne un coût de réseau plus élevé, mais lorsque seuls les niveaux les plus élevés font l’affaire, c’est la meilleure solution.
Nous espérons que cela contribuera à démystifier tous les types de protection que vous pouvez obtenir. Lorsque vous évaluez ce dont vous avez besoin, prenez en compte non seulement ce qui est spécifiquement protégé, mais aussi le temps de récupération et les coûts d’infrastructure – principalement le traitement et la mise en réseau.
Vous voulez en savoir plus sur les disponibilités à Stratus? Cliquez sur le lien ci-dessous !
[sc name=”Availability_CTA_1″]