到底什么是高可用性？

作者: Jason Andersen 2015 年 6 月 11 日

因此，在Stratus ，几十年来我们一直是可靠计算基础设施的领导者。然而，像技术领域的许多术语一样，高可用性（HA）的定义非常广泛。去年，我们看到一家备受尊敬的分析公司的调查，说大多数被调查者认为高可用性意味着有一个灾难恢复计划。我们发现，当你与在不同计算平台上工作过的人交谈时，定义也会发生变化（例如，大型机与开发/运营部门对此的看法非常不同）。IDC有一套他们使用多年的可用性级别，但它们似乎有点宽泛，因为大多数技术都属于超级宽泛的AL3类别。

那么，高可用性到底什么？下面是我们根据对终端用户产生的影响给出的定义。

对终端用户造成重大影响（通常按小时衡量停机时间– IDC称之为 AL1 和 AL2）

无保护措施 – 这应该很好理解，它是指在应用层、监控程序层或基础设施层均未实施任何特殊的可靠性功能的工作负载。如果工作负载停机，就真的停机了。

备份 – 这是一个定期复制（或快照）到不同节点或数据中心的工作负载。这是一个很好的合规性措施，可以帮助恢复（如果你有几个小时或更多）。

灾难恢复 – 这是一种更强大的备份形式，在发生重大故障事件（这可能是人为错误或因天气原因导致的重大数据中心故障）时，自动进行快速恢复。

对终端用户造成轻微影响（通常按秒或分钟衡量停机时间，IDC 称之为 AL3）

自动高可用性 – 这在虚拟化世界中非常普遍。当出现故障时，工作负载的新实例被重新部署到新的节点或数据中心。这方面的一个常见实现是VMware的HA功能。这个功能对基础设施的影响最小，但对用户的干扰相当大，所有飞行中的数据都会丢失。这是一个很好的解决方案，适用于负载平衡、扩展的应用，如网络服务器。

即时高可用性 – 这是裸机世界中的集群或虚拟化世界中的冗余实例和复制存储的世界。服务的中断是最小的（在某些情况下甚至是亚秒）。然而，任何飞行中的数据和/或事务都会丢失。如果你的应用程序是无状态的，但不是负载平衡的，这是一个伟大的解决方案。

对终端用户不产生影响（不会停机 – IDC 称之为 AL4）

容错性– 这是一种曾经只在大型机和微型计算机世界中才知道的能力。然而，Stratus ，使硬件、软件和云解决方案为现成的操作系统和管理程序提供这种保护水平，其价格与较低的保护水平相当。容错是工作负载的完全冗余，它也共享机上数据和应用状态。这意味着，即使在发生故障的情况下，也有连续的、不间断的操作。

多站点容错 – 这是一个工作负载可以得到的最高级别的保护。它提供了容错性，因此不会有状态或数据的损失，但冗余的工作负载被托管在不同的站点。自然，这种类型的解决方案有较高的网络成本，但当只有最高级别时，这就是最好的。

希望本篇文章能够帮您理解所有的防护类型。您在评估需求时，不仅要考虑保护的对象，还要考虑恢复时间和基础设施成本 – 主要是处理器和网络成本。

想了解更多关于Stratus 的可用性？请点击下面的链接!

[sc name=”可用性_CTA_1″]

Jason Andersen

作为业务线管理副总裁，Jason Andersen 负责制定 Stratus 产品和服务的产品路线图和上市战略。Jason 对本地部署和基于云的基础架构都有深刻的理解，近20年来，他一直负责产品和服务的成功交付。Jason 于2013年加入 Stratus。此前，Jason 曾担任红帽公司的产品线管理总监，负责 JBoss 应用产品的市场策略、产品介绍和发布，以及产品营销。此前，Jason 还曾在红帽公司和 IBM 软件集团担任产品管理岗位。

到底什么是高可用性？

对终端用户造成重大影响（通常按小时衡量停机时间– IDC称之为 AL1 和 AL2）

对终端用户造成轻微影响（通常按秒或分钟衡量停机时间，IDC 称之为 AL3）

对终端用户不产生影响（不会停机 – IDC 称之为 AL4）

相关文章