가용성 서버 중단: 더 빠른 복구 방법

서버 가동 중단은 발생하게 되어 있으며, 누구에게나 발생합니다. 이 사실을 인정하지 않는 것은 자동차 제조사에서 차가 충돌하지 않을 것이라고 약속했기 때문에 에어백이 없는 차를 운전하는 것과 같습니다.

2017년 신뢰성 있는 Amazon Web Services(AWS)는 4시간 동안 중단되어 AWS를 백엔드 공급자로 사용하는 모든 비즈니스에 영향을 미쳤습니다. 4시간은 거대한 시스템을 복원하는 데 그리 긴 시간은 아닌 것 같습니다. 그러나 연중 24시간 액세스되는 Netflix 같은 AWS 고객에게 그 4시간은 엄청나게 값비싼 시간이었습니다.

그렇다면 접근성에 의존하는 조직과 고객을 어떻게 보호할 수 있을까요? 가용성 솔루션 공급업체와 함께 작업할 때는 가장 빠른 복구 시간을 제공하는 시스템을 구성하는 것이 중요합니다. 가장 좋은 것은 고객이 서버가 중단된 것도 모르도록 하는 시스템입니다.

가동 중지 시간 방지 구매자 가이드에서는 서버 오류를 포함하여 가동 중지 시간을 방지하기 위해 요청해야 하는 6가지 질문에 대해 설명합니다. 가이드는 “서버 오류가 발생할 경우 응용 프로그램을 정상적인 처리 작업으로 복원하는 프로세스는 무엇이며 얼마나 오래 걸리는가?”와 같은 질문을 하는 것이 좋습니다. 또한 이 가이드는 특정 시스템과 예상할 수 있는 다양한 가동 중지 시간을 비교합니다.

“독립 실행형 서버에 의존하는 경우 정기적으로 시스템을 백업한 경우 백업에서 응용 프로그램과 데이터를 복원하는 데 필요한 높은 수준의 인적 상호 작용을 감안할 때 복구 시간이 몇 분에서 며칠까지 다양할 수 있습니다.
고가용성 클러스터를 사용하면 서버 가동 중단 중에 처리가 중단되고 가용성이 복원되면 파일 무결성을 확인하고 데이터베이스를 롤백하고 트랜잭션 로그를 재생하는 데 걸리는 시간에 따라 복구가 몇 분에서 몇 시간 까지 걸릴 수 있습니다. 초기 계획 단계에서 클러스터의 크기가 올바르게 조정된 경우 결함이 있는 서버가 작동 중이 아닌 동안 사용자는 느린 응용 프로그램 성능을 경험해서는 안 됩니다. 그러나 정상적인 처리가 다시 시작되면 저널 파일을 사용하여 일부 트랜잭션을 다시 실행해야 할 수 있습니다.
내결함성 솔루션은 단일 오류 지점을 제거하는 완전히 복제된 구성 요소로 가동 중지 시간을 사전에 방지합니다. 일부 플랫폼은 복제된 구성 요소를 자동으로 관리하여 잠금 단계에서 모든 처리를 실행합니다.
복제된 구성 요소는 동일한 명령을 동시에 수행하므로 구성 요소가 실패하더라도 처리가 중단되지 않습니다. 즉, 독립 실행형 서버 또는 고가용성 클러스터와 달리 오류 내성 솔루션은 문제가 해결되는 동안 계속 작동합니다.”

전체 가동 중지 시간 방지 구매자 가이드를 다운로드하고 가동 중지 시간을 방지하기 위해 요청해야 할 나머지 다섯 가지 질문을 발견하십시오.

관련 게시물