取消
搜索历史

    云灾难恢复最佳实践

    来源:容灾网 2021-12-15 11:35容灾/BCM

    什么是云容灾?

    灾难恢复是指组织为灾难做准备和从灾难中恢复的过程。作为组织业务连续性计划的一个组成部分,灾难恢复旨在保护组织的资产。因此,云灾难恢复计划是一组程序和措施,以确保组织平稳运行,由云提供商提供的专用设施的使用提供支持。

    云灾难的发生

    要了解如何为云灾难做好准备,了解这些灾难可能如何发生非常重要。首先,业务资产可能会以技术故障的形式暴露在云灾难中,例如,当电源或网络连接中断时。 

    其次,在托管您正在使用的云服务的服务器所在的地区可能会发生风暴、洪水或地震等自然灾害,从而导致服务中断和中断。

    云灾难可能以人为灾难的形式发生,这比自然灾害更常见,并且可能涉及导致严重服务中断的简单错误。它们经常在使用云服务时发生,不幸的是无法根除。例如,它们可能是由打字错误、简单的错误配置、意外删除或未能执行软件更新而触发的——这使得威胁行为者可以轻松控制云服务。

    当威胁行为者通过勒索软件等恶意软件访问云服务时,他们就会对组织的基础设施构成威胁。这些威胁行为者很容易导致服务中断,并为了自己的利益而令人沮丧地中断运营。勒索软件是当今云数据的一大挑战,而这些威胁不断发展的事实使它们变得更加令人生畏。

    为云灾难做准备

    要为云灾难做好准备,您需要不断测试您的数据恢复框架。企业可以进行一些测试:

    • 全中断测试。作为可以执行的最彻底的测试,完整中断测试会停止运营并复制灾难,以衡量企业如何应对实际灾难。它可能代价高昂,并且在不成功的情况下可能会无意中造成重大中断。
    • 演练测试。与完全中断测试相比,此测试不那么彻底,它审查灾难恢复计划,并提供机会找出差距以改进灾难恢复计划。
    • 并行测试。恢复操作在与主系统不同的网络上执行。
    • 模拟测试。模拟灾难以提示团队模拟他们记录的灾难恢复计划。这可以随机进行,以衡量响应者的准备情况和现有策略的有效性。

    云容灾的重要性

    云容灾减少了对物理基础设施的依赖。这简化了企业的运营,因为企业将其灾难恢复工作负载外包。此外,企业无需升级或支持其物理基础设施以在远程站点进行灾难恢复。基于云的服务提供了额外的优势,例如自动化,这是减少人为错误的一种方法。

    与本地灾难恢复相比,云灾难恢复更加简单。通过云方法可以简化与管理自己的灾难恢复过程相关的复杂性。例如,测试数据恢复框架不仅更容易,而且更可行。

    此外,企业在选择恢复方法时享有很大的灵活性。组织可以经济高效地组合各种恢复方法,而不会影响他们所需的服务。云灾难恢复选项提供高可扩展性,因为服务器和基础设施可以基于现收现付等模型进行扩展。

    云灾难恢复最佳实践

    选择合适的灾难恢复计划方法

    要制定合适的灾难恢复计划,了解您的 IT 基础架构非常重要。通过这种方式,您可以选择正确的灾难恢复计划方法。您可以使用备份和恢复方法,这需要使用托管备份解决方案在您方便时处理数据的备份和恢复。

    根据您的要求,指示灯拓扑可能是有效的。这种方法通过减少活动资源来降低灾难恢复的成本,由于关键数据和应用程序都在一个地方,因此在面对灾难时更容易恢复数据。其他方法包括热备用,它具有部署在两个或更多活动位置的数据和应用程序的完整副本,以及热备用,它具有系统核心元素的副本并与系统同时运行。

    选择有能力的容灾服务商

    战略性灾难恢复评估和规划必须有彻底定义的程序,您可能无法自行执行。例如,灾难恢复服务提供商可以帮助您进行彻底的业务影响分析,以帮助您熟悉在灾难期间可能遇到的操作限制。

    因此,选择一个智能、务实且以解决方案为导向的服务供应商非常重要,他们可以帮助制定有影响力的云灾难恢复计划。这样的服务提供商将为您的用例提供正确的工具。他们还可以对您的数据的潜在危险进行更好的评估。

    为您的灾难恢复计划定义 RPO 和 RTO

    在制定组织的灾难恢复计划时,恢复点目标(RPO) 和恢复时间目标(RTO) 是有价值的指标。它们在特定服务中断期间提供业务连续性的保证。

    RPO 可帮助组织了解在灾难期间可接受的数据量损失。另一方面,RTO 控制组织的基础设施在灾难后实现正常运行所需的速度,并涉及减灾和恢复的步骤。因此,考虑 RTO 和 RPO 有助于组织决定灾难恢复框架以满足其恢复目标。

    定期测试和更新您的计划

    灾难恢复计划的例行测试可衡量计划在发生灾难时的预期效果。此外,由于灾难恢复目标应该与业务目标保持一致,业务格局的不断演变使得始终测试灾难恢复计划以确保它们不会过时变得更加必要。

    信息技术也在定期变化。因此,为了跟上技术进步,组织的基础设施必须相应地发展,不仅要通过测试,还要更新灾难恢复计划,以确保逐步提高计划的效力。

    考虑灾难恢复即服务 (DRaaS)

    当组织缺乏内部灾难恢复团队时,灾难恢复即服务 (DRaaS) 成为一种可行的选择。DRaaS 提供商可能会为组织提供量身定制的最佳实践,以满足他们的业务需求。由于 DRaaS 使用云资源,因此它很容易成为创建二级基础设施的一种手段,以在面临灾难时保护组织的关键任务数据。

    DRaaS 还可以为组织节省资金,因为他们得到了他们所支付的费用。例如,通过这样的计划,您最终不会为不使用的存储空间付费。此外,与内部解决方案相比,DRaaS 可以在灾难发生后提供更快的恢复时间。

    (文章为作者独立观点,不代表存储网立场,版权疑问请联系客服。)
    关于我们| 隐私条例| 版权申明| 联系我们

    2018-2022 Copyright © Stor.com.cn