Home Disponibilità Che cos’è esattamente l’alta disponibilità?

Che cos’è esattamente l’alta disponibilità?

da Jason Andersen

Quindi, all’indirizzo Stratus siamo e siamo stati i leader nell’infrastruttura informatica affidabile per decenni. Tuttavia, come molti termini nella tecnologia, la definizione di Alta Disponibilità (HA) è molto ampia. L’anno scorso abbiamo visto un sondaggio di una società di analisi molto rispettata che diceva che la maggioranza degli intervistati pensava che Alta disponibilità significasse avere un piano di disaster recovery. E abbiamo scoperto che la definizione si sposta anche quando si parla con persone con una storia nelle diverse piattaforme informatiche (cioè il mainframe vs dev/ops vedono questo in modo molto diverso). IDC ha una serie di livelli di disponibilità che hanno usato per anni, ma sembrano un po’ ampi, dato che la maggior parte delle tecnologie là fuori rientrano nella super ampia categoria AL3.

Allora, cos’è l’alta disponibilità? Ecco le nostre definizioni raggruppate per impatto dell’utente finale.

Impatto significativo sull’utente finale (generalmente misurato in ore di fermo macchina – IDC lo chiama AL1 e AL2)

Non protetto – Questo è probabilmente abbastanza facile da capire. Si tratta di un carico di lavoro che non ha particolari caratteristiche di affidabilità implementate né a livello di applicazione, né a livello di hypervisor, né a livello di infrastruttura. Se va giù, è giù.

Backup – Questo è un carico di lavoro che viene periodicamente copiato (o snapshottato) su un nodo diverso o data center. Questa è una bella misura di conformità e può aiutare a recuperare (se si hanno ore o più)

Disaster Recovery – Questa è una forma più robusta di backup che è automatizzata per un recupero più rapido in caso di un grande evento di guasto (questo potrebbe essere un errore umano o un grande guasto data center dovuto al tempo)

Impatto minimo sull’utente finale (generalmente misurato in secondi o minuti di fermo macchina – IDC chiama questo AL3)

Alta disponibilità automatizzata – Questo è molto comune nel mondo virtualizzato. Quando c’è un guasto, una nuova istanza del carico di lavoro viene ridispiegata su un nuovo nodo o data center. Un’implementazione comune di questo è la funzione HA di VMware. Questa funzione ha un impatto minimo sull’infrastruttura ma ha un’interruzione abbastanza alta per gli utenti e tutti i dati in volo vengono persi. Questa è una buona soluzione per il bilanciamento del carico, applicazioni scalate come i server web.

Alta disponibilità istantanea – Questo è il mondo dei cluster nel mondo bare metal o delle istanze ridondanti e dello storage replicato nel mondo virtualizzato. L’interruzione del servizio è minima (anche un sub-secondo in alcuni casi). Tuttavia, tutti i dati e le transazioni in volo sono persi. Se la vostra applicazione è stateless ma non è bilanciata nel carico, questa è una grande soluzione.

Impatto zero sull’utente finale (Nessun tempo di inattività – IDC chiama questo AL4)

Tolleranza ai guasti – Questa è una capacità che una volta era conosciuta solo nel mondo dei mainframe e dei minicomputer. Tuttavia, Stratus fa soluzioni hardware, software e cloud che forniscono questo livello di protezione a sistemi operativi e hypervisor off the shelf a un prezzo che è paragonabile a livelli di protezione inferiori. La tolleranza ai guasti è una ridondanza completa del carico di lavoro che condivide anche i dati in volo e lo stato dell’applicazione. Questo significa che c’è un funzionamento continuo e ininterrotto anche in caso di guasto.

Multi-Site Fault Tolerance – Questo è il più alto livello di protezione che un carico di lavoro può ottenere. Fornisce Fault Tolerance, quindi non c’è perdita di stato o di dati, ma i carichi di lavoro ridondanti sono ospitati in siti diversi. Naturalmente, c’è un costo di rete più alto per questo tipo di soluzione, ma quando solo i livelli più alti vanno bene, questo è il migliore.

Speriamo che questo aiuti a de-mitificare tutti i tipi di protezione che si possono ottenere. Quando si valuta ciò che è necessario considerare non solo ciò che viene protetto in modo specifico, ma anche il tempo di recupero e i costi dell’infrastruttura – principalmente l’elaborazione e il collegamento in rete.

Vuoi saperne di più sulla disponibilità su Stratus? Clicca sul link qui sotto!


[sc name=”Availability_CTA_1″]

MESSAGGI CORRELATI