RTO против RPO: почему цели восстановления важны для успеха ИТ
Опубликовано: 2023-09-07Предприятия осознают, что простой ИТ-инфраструктуры будет стоить дороже.
Компании должны учитывать последствия простоя и сосредоточиться на обеспечении непрерывности бизнес-операций. Для этого необходимо реализовать надлежащий план обеспечения непрерывности бизнеса, который позволит минимизировать время простоя или полностью избежать его. Таким образом, компании могут обеспечить устойчивость своей ИТ-инфраструктуры.
Обсуждая время простоя бизнеса, вы часто слышите о целевом времени восстановления (RTO) и целевых точках восстановления (RPO). Для каждого бизнеса крайне важно иметь полное представление о RTO и RPO, чтобы обеспечить быстрое восстановление после аварии.
RTO и RPO – в чем разница?
RTO — это желаемый предел простоя после аварии, указывающий, насколько быстро необходимо восстановить системы. Принимая во внимание, что RPO — это допустимый предел потери данных, показывающий, какой объем данных система может позволить себе потерять.
Выбор правильного программного обеспечения для аварийного восстановления как услуги (DRaaS) позволяет предприятиям внедрять мощные решения, которые соответствуют их целям RTO и RPO с минимальной потерей данных.
В этой статье мы обсудим, как измерить RTO и RPO, роль этих показателей в резервном плане обеспечения непрерывности бизнеса, а также как определить и достичь целей RTO и RPO вашего бизнеса.
Каково целевое время восстановления (RTO)?
Целевое время восстановления (RTO) — это ключевой показатель, который помогает вам рассчитать, насколько быстро необходимо восстановить систему или приложение после простоя, чтобы не оказать существенного влияния на бизнес-операции. Короче говоря, RTO — это мера того, сколько времени простоя вы можете вытерпеть.
В случае непредвиденных сбоев одна или две системы могут выйти из строя, и вам придется простоять, пока проблема не будет решена. Это ставит вас в ситуацию, когда вам необходимо определить время, в течение которого вам необходимо восстановить систему, чтобы ваша бизнес-операция не прерывалась. Здесь на помощь приходит RTO.
Определение RTO предполагает понимание допустимого времени простоя каждой системы, и для каждого из ваших приложений у вас, вероятно, будут разные RTO. После того как вы определите метрику RTO, вы сможете составить план восстановления, включающий стратегию восстановления и технологию, необходимые для успешного и быстрого восстановления после простоя.
Какова целевая точка восстановления (RPO)?
Целевая точка восстановления (RPO) — это показатель, который вы устанавливаете для определения объема потери данных, который ваш бизнес может выдержать и продолжать функционировать без какого-либо влияния на бизнес-операции.
Чтобы определить RPO, вам необходимо оценить критичность данных, чтобы знать, нужно ли вам восстанавливать все данные или их часть, и могут даже быть данные, которые относительно менее значимы и не нуждаются в восстановлении. Исходя из этого, вы сможете определить RPO для своей системы: чем выше критичность данных, тем меньше должно быть значение RPO.
Определение RPO является важной частью плана резервного копирования, поскольку оно помогает вам установить частоту резервного копирования данных в зависимости от их критичности.
Различия между RTO и RPO
RTO и RPO — важные элементы, связанные с планами резервного копирования и аварийного восстановления. И RTO, и RPO определяются и измеряются в единицах времени. Хотя RTO и RPO могут звучать одинаково, между ними есть некоторые существенные различия:
Целевое время восстановления (RTO) | Целевая точка восстановления (RPO) |
Связано с допустимым временем простоя до выздоровления. | Относится к допустимой потере данных. |
Связано со временем, затраченным на восстановление. | Связано с частотой резервного копирования. |
Связано с восстановлением нормального состояния с учетом последних данных. | Связано с тем, какими будут последние восстановленные данные. |
Сосредоточено на технологиях восстановления, необходимых для достижения целей, включая восстановление всей системы или только приложения или более детального уровня. | Сосредоточено на автоматизации резервного копирования вашей системы через определенные промежутки времени. |
RTO против RPO: как минимизировать время простоя бизнеса
Простои ИТ происходят по множеству причин, таких как сбои системы, сбои сети или приложений, потеря данных из-за атаки программы-вымогателя или катастрофы на сайте из-за стихийных бедствий. Если произойдет какое-либо из вышеупомянутых непредвиденных обстоятельств, это может остановить ваши процессы и стоить вам дороже.
Приложения имеют решающее значение и должны быть всегда доступны. Сбой критического приложения вашего бизнеса приводит к перебоям в работе приложения, а также к потере данных. Это оказывает прямое влияние на ваши бизнес-операции как в краткосрочной, так и в долгосрочной перспективе, а также влияет на вашу производительность, доходы и бренд. В некоторых крайних случаях это может даже привести к банкротству вашей компании.
Время простоя приложения может варьироваться в зависимости от бизнеса, но решающим фактором здесь является сокращение времени простоя за счет быстрого восстановления доступности приложения.
Чтобы обеспечить своевременный запуск и работу ваших систем, каждому предприятию необходимо иметь надежную стратегию защиты данных, то есть план резервного копирования и аварийного восстановления. Выбирая план резервного копирования и аварийного восстановления для вашего бизнеса, вам следует искать решение, которое предлагает более короткие RTO и RPO. Это позволяет добиться минимального времени простоя и обеспечить непрерывность бизнеса за счет восстановления системы при необходимости.
Риски игнорирования метрик RTO и RPO
Метрики RTO и RPO помогут вам минимизировать риски, связанные с простоями, если вы правильно их оцените и определите. Эти показатели должны соответствовать целям восстановления вашего бизнеса и управлению соглашением об уровне обслуживания (SLA).
Если вы не определите RTO и RPO должным образом, это может привести к любому уровню риска, от менее серьезного до серьезного. Кроме того, вы не сможете восстановить данные с нужного момента времени, что может привести к потере данных и прерыванию бизнес-процессов. Кроме того, вы не сможете запустить свою систему в нужное время.
В обоих случаях, упомянутых выше, перерыв в работе может привести к потере производительности. В худшем случае это приведет к потере доходов и может вызвать серьезные последствия, такие как потеря деловой репутации.
Как достичь RTO и RPO с помощью плана резервного копирования и аварийного восстановления
Любые решения для резервного копирования и аварийного восстановления, которые вы рассматриваете, будут указывать гарантированные RPO и RTO в своем соглашении об уровне обслуживания. Всегда проверяйте, что выбранное вами решение для резервного копирования и аварийного восстановления обеспечивает достижение целевых показателей восстановления: RTO и RPO.
Решения для резервного копирования и аварийного восстановления предлагают множество функций для достижения целей RTO и RPO вашего бизнеса. Мы рассмотрим некоторые важные функции, необходимые для решения резервного копирования и аварийного восстановления, которое поможет вашему бизнесу достичь практически нулевого RTO и RPO.
Гибкая политика планирования
Современные решения для резервного копирования и аварийного восстановления предлагают гибкие политики планирования для определения RPO для ваших приложений. Политики планирования позволяют запускать автоматическое резервное копирование через регулярные промежутки времени, например, каждые несколько минут, каждые несколько часов или один раз в день. Это значительно упрощает реализацию RPO.
Непрерывная защита данных (CDP) гарантирует, что каждый раз, когда в вашей системе/приложении вносится изменение, оно мгновенно копируется или реплицируется. Это решает проблему, связанную с риском потери данных, созданных между двумя запланированными резервными копиями, и позволяет достичь нулевого показателя RPO. Однако при включении CDP для критических рабочих нагрузок могут возникнуть проблемы с производительностью или стабильностью, поскольку он использует больше ресурсов. По этим причинам CDP широко используется для резервного копирования на уровне файлов.
Почти непрерывную защиту данных можно установить почти на ноль и запускать через регулярные промежутки времени. Это близко к достижению эффекта CDP и может быть включено для выполнения резервного копирования/репликации на уровне образа, использующего технологию моментальных снимков или другую технологию. Большинство представленных на рынке решений резервного копирования и аварийного восстановления позволяют достичь практически нулевого RPO менее 15 минут для вашей критически важной системы.
Возможности мгновенного восстановления
Вашему бизнесу требуется возможность достижения практически нулевых показателей RTO, которых можно достичь за счет мгновенного восстановления.
Одной из возможностей мгновенного восстановления, которая необходима каждому предприятию в рамках плана резервного копирования и аварийного восстановления, является возможность мгновенной загрузки машины, для которой выполнено резервное копирование, непосредственно из хранилища резервных копий в качестве виртуальной машины, готовой к продолжению бизнес-операций.
Вы можете немедленно запустить машину в виртуальной среде из последней резервной копии или в любой момент времени, используя данные резервной копии в зашифрованном и сжатом формате в вашем хранилище резервных копий. Теперь вы можете запустить свою критически важную систему в течение нескольких минут и обеспечить непрерывность бизнеса при практически нулевом времени восстановления.
Благодаря этому вы сможете свести к минимуму время простоя, и все ваши критически важные системы уровня 1 продолжат работать, не влияя на бизнес. Позже вы можете перенести мгновенно загрузившуюся виртуальную машину в рабочую среду для постоянного восстановления.
Гранулированное восстановление
Роль выборочного восстановления в плане резервного копирования и аварийного восстановления играет важную роль. Он предоставляет вам возможность восстановить только те данные, которые вам нужны.
С помощью этой опции вы можете выборочно восстановить файл или элемент приложения непосредственно из резервной копии. Если вы случайно удалили файл, вы можете легко выбрать и восстановить этот конкретный файл. Кроме того, вы можете сразу восстановить определенную почту или почтовый ящик, вместо того, чтобы восстанавливать всю базу данных или приложение. Теперь вы сможете достичь RTO в несколько минут. Это экономит время и ресурсы, поскольку нет необходимости каждый раз восстанавливать всю машину, чтобы восстановить отдельный элемент.
Живая репликация с аварийным переключением
Динамическая репликация позволяет создавать точную копию ваших производственных рабочих нагрузок на другом сайте и часто реплицировать изменения на машину-реплику, настраивая RPO, близкий к нулю.
Если ваш исходный компьютер становится недоступным из-за какого-либо сбоя или повреждения, вы можете немедленно выполнить операцию аварийного переключения, которая плавно переключает производственные операции на ваш компьютер-копию. Без каких-либо простоев или последствий вы сможете продолжать свою бизнес-операцию, достигая при этом практически нулевых целевых показателей RTO. В случаях, когда RTO и RPO близки к нулю, вы можете использовать функции репликации и аварийного переключения и поддерживать постоянную доступность производственных рабочих нагрузок.
Внешнее копирование для аварийного восстановления
Никто не может предсказать катастрофу. В случае сбоя всего сайта даже ваши локальные резервные копии становятся недоступными и подвергают риску ваш бизнес, не имея возможности восстановить ваши данные.
По этой причине полезно иметь план аварийного восстановления, который позволит вам создать дополнительную копию резервной копии и хранить ее в удаленном месте, которое может быть либо локальным центром обработки данных, либо общедоступным облаком. Благодаря удаленному резервному копированию вы можете восстановить свою систему в случае аварии и легко достичь целей восстановления вашего бизнеса.
Защити, восстанови и повтори
Планы резервного копирования и аварийного восстановления являются чрезвычайно важной частью работы в случае стихийного бедствия. Как обсуждалось выше, одним из основных аспектов обеспечения непрерывности операций в случае аварии является правильное указание показателей RTO и RPO в плане резервного копирования и аварийного восстановления.
Определите значения RTO и RPO, внедрите решение, соответствующее соглашениям об уровне обслуживания вашего бизнеса, например инструменты мониторинга SLA, и обеспечьте постоянную доступность вашего бизнеса.