Página inicial Disponibilidade O que é exatamente a Alta Disponibilidade, afinal?

O que é exatamente a Alta Disponibilidade, afinal?

por Jason Andersen

Portanto, na Stratus somos e temos sido os líderes em infra-estrutura computacional confiável por décadas. Entretanto, como muitos termos em tecnologia, a definição de Alta Disponibilidade (HA) é muito ampla. No ano passado, vimos uma pesquisa de uma empresa analista altamente respeitada que disse que a maioria dos pesquisados pensava que Alta Disponibilidade significava ter um plano de recuperação de desastres. E descobrimos que a definição também se move quando se fala com pessoas com história nas diferentes plataformas de computação (ou seja, o mainframe vs dev/ops vêem isto de forma muito diferente). A IDC tem um conjunto de Níveis de Disponibilidade que eles têm usado durante anos, mas eles parecem um pouco amplos uma vez que a maioria das tecnologias por aí caem na categoria super ampla AL3.

Então, o que é alta disponibilidade? Aqui estão nossas definições agrupadas por impacto sobre o usuário final.

Impacto significativo para o usuário final (Geralmente medido em horas de inatividade – IDC chama isso de AL1 e AL2)

Desprotegido – Isto provavelmente é muito fácil de entender. Esta é uma carga de trabalho que não tem características especiais de confiabilidade implementadas tanto na camada de aplicação, hipervisor ou infra-estrutura. Se for abaixo; é abaixo.

Backup – Esta é uma carga de trabalho que é periodicamente copiada (ou fotografada) para um nó ou centro de dados diferente. Esta é uma boa medida de conformidade e pode ajudar a se recuperar (se você tiver horas ou mais).

Recuperação de desastres – Esta é uma forma mais robusta de backup que é automatizada para uma recuperação mais rápida no caso de um evento de falha importante (pode ser um erro humano ou uma falha importante do centro de dados devido ao tempo).

Impacto mínimo para o usuário final (Geralmente medido em segundos a minutos de inatividade – a IDC chama isso de AL3)

Alta Disponibilidade Automatizada – Isto é muito comum no mundo virtualizado. Quando há uma falha, uma nova instância da carga de trabalho é redistribuída para um novo nó ou centro de dados. Uma implementação comum disto é a característica HA da VMware. Este recurso tem um impacto mínimo na infra-estrutura, mas tem uma interrupção bastante alta do usuário e todos os dados em vôo são perdidos. Esta é uma boa solução para aplicações de carga balanceada e dimensionada, como servidores web.

Alta Disponibilidade Instantânea – Este é o mundo dos clusters no mundo do metal nu ou instâncias redundantes e armazenamento replicado no mundo virtualizado. A interrupção do serviço é mínima (mesmo um sub-segundo em alguns casos). Entretanto, quaisquer dados e/ou transações de vôo são perdidos. Se sua aplicação é sem estado, mas não tem carga balanceada, esta é uma ótima solução.

Impacto Zero para o Usuário Final (Sem Tempo de Parada – IDC chama este AL4)

Tolerância a falhas – Esta é uma capacidade que uma vez só foi conhecida no mundo do mainframe e dos minicomputadores. Entretanto, a Stratus fabrica soluções de hardware, software e nuvem que fornecem este nível de proteção aos sistemas operacionais e hipervisores fora da prateleira a um preço comparável aos níveis de proteção mais baixos. A tolerância a falhas é uma redundância completa da carga de trabalho que também compartilha os dados de vôo e o estado da aplicação. Isto significa que há uma operação contínua e ininterrupta mesmo no caso de uma falha.

Tolerância a falhas em vários locais – Este é o mais alto nível de proteção que uma carga de trabalho pode obter. Ele proporciona Tolerância a Falhas, de modo que não há perda de estado ou dados, mas as cargas de trabalho redundantes são hospedadas em locais diferentes. Naturalmente, há um custo de rede mais alto para este tipo de solução, mas quando apenas os níveis mais altos servem, este é o melhor.

Esperamos que isto ajude a desmistificar todos os tipos de proteção que você pode obter. Ao avaliar o que você precisa, considere não apenas o que especificamente está sendo protegido, mas também o tempo de recuperação e os custos de infra-estrutura – principalmente processamento e rede de contatos.

Deseja saber mais sobre a disponibilidade na Stratus? Clique no link abaixo!


[sc name=”Availability_CTA_1″]

POSTS RELACIONADOS