RTO x RPO: Por que os objetivos de recuperação são importantes para o sucesso da TI
Publicados: 2023-09-07As empresas estão cientes de que o tempo de inatividade de TI custará mais.
As empresas devem considerar as implicações do tempo de inatividade e concentrar-se na manutenção da continuidade das operações comerciais. Para fazer isso, um plano de continuidade de negócios adequado precisa ser implementado para permitir minimizar o tempo de inatividade ou evitá-lo completamente. Desta forma, as empresas podem garantir que a sua infraestrutura de TI seja resiliente.
Ao discutir o tempo de inatividade dos negócios, você costuma ouvir falar de objetivos de tempo de recuperação (RTO) e objetivos de ponto de recuperação (RPO). É fundamental que todas as empresas tenham uma compreensão completa do RTO e do RPO para garantir uma recuperação rápida após um desastre.
RTO x RPO – Qual a diferença?
RTO é o limite de tempo de inatividade desejado após um desastre, indicando a rapidez com que os sistemas devem ser restaurados. Considerando que RPO é o limite aceitável de perda de dados, mostrando quantos dados um sistema pode perder.
A escolha do software certo de recuperação de desastres como serviço (DRaaS) capacita as empresas a implementar soluções poderosas que atendam aos seus objetivos de RTO e RPO com perda mínima de dados.
Neste artigo, discutiremos como medir o RTO e o RPO, o papel dessas métricas em um plano de continuidade de negócios de backup e como definir e atingir as metas de RTO e RPO do seu negócio.
Qual é o objetivo de tempo de recuperação (RTO)?
O objetivo de tempo de recuperação (RTO) é uma métrica importante que ajuda a calcular a rapidez com que um sistema ou aplicativo precisa ser recuperado após um tempo de inatividade para que não haja impacto significativo nas operações de negócios. Resumindo, o RTO é a medida de quanto tempo de inatividade você pode tolerar.
Em caso de interrupções inesperadas, um ou dois sistemas podem falhar e você enfrentará um tempo de inatividade até que o problema seja resolvido. Isso coloca você em uma situação em que precisa determinar o tempo dentro do qual precisa restaurar o sistema para que suas operações comerciais não sejam interrompidas. É aqui que entra o RTO.
Definir o RTO envolve entender o tempo de inatividade tolerado de cada sistema e, para cada uma de suas aplicações, você provavelmente terá RTOs diferentes. Depois de definir a métrica de RTO, você estará pronto para planejar a recuperação, que inclui a estratégia e a tecnologia de recuperação necessárias para uma restauração rápida e bem-sucedida após o tempo de inatividade.
Qual é o objetivo do ponto de recuperação (RPO)?
Um objetivo de ponto de recuperação (RPO) é uma métrica que você define para a quantidade de perda de dados que sua empresa pode suportar e continuar funcionando sem qualquer efeito nas operações comerciais.
Para determinar o RPO, é necessário avaliar a criticidade dos dados para saber se é necessário recuperar todos os dados ou parte deles, e pode até haver dados que são relativamente menos significativos e não precisam ser restaurados. Com base nisso, você poderá definir o RPO para o seu sistema: quanto maior a criticidade dos dados, menor deverá ser o valor do RPO.
Determinar o RPO é uma parte essencial de um plano de backup, pois ajuda você a definir a frequência com que deseja fazer backup de seus dados com base em sua criticidade.
Diferenças entre RTO e RPO
RTO e RPO são elementos importantes associados aos planos de backup e recuperação de desastres. Tanto o RTO quanto o RPO são definidos e medidos em unidades de tempo. Embora RTO e RPO possam parecer parecidos, existem algumas diferenças importantes:
Objetivo de tempo de recuperação (RTO) | Objetivo de ponto de recuperação (RPO) |
Relacionado ao tempo de inatividade tolerável até a recuperação. | Relacionado à perda de dados tolerável. |
Relacionado ao tempo necessário para restaurar. | Relacionado à frequência de backup. |
Relacionado à restauração ao normal com os dados mais recentes. | Relacionado a como serão os últimos dados recuperados. |
Focado nas tecnologias de recuperação necessárias para cumprir as metas, incluindo a restauração de todo o sistema ou apenas da aplicação ou em um nível mais granular. | Focado em automatizar os backups do seu sistema em intervalos adequados. |
RTO vs. RPO: como minimizar o tempo de inatividade dos negócios
O tempo de inatividade da TI ocorre devido a vários motivos, como falhas no sistema, falhas de rede ou de aplicativos, perda de dados devido a um ataque de ransomware ou desastres no local devido a calamidades naturais. Se algum dos imprevistos acima mencionados acontecer, pode travar seus processos e custar mais caro.
Os aplicativos são cruciais e precisam estar sempre disponíveis. Uma falha em uma aplicação crítica do seu negócio leva à interrupção do serviço da aplicação e também resulta em perda de dados. Isso tem um impacto direto em suas operações comerciais, tanto no curto quanto no longo prazo, e afeta sua produtividade, receita e marca. Em alguns casos extremos, pode até fazer com que sua empresa feche.
O tempo de inatividade tolerado de um aplicativo pode variar dependendo do negócio, mas o fator crítico aqui é reduzir o tempo de inatividade restaurando rapidamente a disponibilidade do aplicativo.
Para colocar seus sistemas em funcionamento em tempo hábil, toda empresa precisa ter uma estratégia sólida de proteção de dados, ou seja, um plano de backup e recuperação de desastres em vigor. Ao selecionar um plano de backup e recuperação de desastres para o seu negócio, você deve procurar uma solução que ofereça um RTO e RPO mais curtos. Isso permite que você obtenha um tempo de inatividade mínimo e garanta a continuidade dos negócios restaurando o sistema quando necessário.
Riscos de ignorar as métricas de RTO e RPO
As métricas de RTO e RPO ajudarão você a minimizar os riscos associados ao tempo de inatividade se você avaliá-los e defini-los corretamente. Essas métricas devem estar alinhadas com seus objetivos de recuperação de negócios e gerenciamento de acordo de nível de serviço (SLA).
Se você não definir RTO e RPO corretamente, isso poderá levar a qualquer nível de risco, de menos a grave. Além disso, você não poderá restaurar os dados no momento necessário, o que pode resultar na perda de dados e interromper processos de negócios. Além disso, você não conseguirá ativar seu sistema dentro do tempo necessário.
Em ambos os casos mencionados acima, a interrupção das operações pode levar à perda de produtividade. Nos piores casos, isto levará à perda de receitas e poderá causar implicações graves, como perda de reputação empresarial.
Como alcançar RTO e RPO com um plano de backup e recuperação de desastres
Qualquer solução de backup e recuperação de desastres que você esteja procurando especificará seu RPO e RTO garantidos em seu SLA. Certifique-se sempre de que a solução de backup e recuperação de desastres escolhida garante as metas do seu objetivo de recuperação: RTO e RPO.
As soluções de backup e recuperação de desastres oferecem múltiplas funcionalidades para atingir as metas de RTO e RPO de sua empresa. Veremos algumas das funcionalidades importantes que você precisa procurar em uma solução de backup e recuperação de desastres que ajudará sua empresa a atingir RTO e RPO próximos de zero.
Políticas de agendamento flexíveis
As soluções atuais de backup e recuperação de desastres oferecem políticas de agendamento flexíveis para definir RPO para seus aplicativos. As políticas de agendamento permitem que você execute um backup automatizado em intervalos regulares, como a cada poucos minutos, a cada poucas horas ou uma vez por dia. Isso torna a implementação do RPO muito mais fácil.
A proteção contínua de dados (CDP) garante que, sempre que uma alteração for feita em seu sistema/aplicativo, seja feito backup ou replicação instantaneamente. Isso resolve o problema em que as empresas correm o risco de perder dados gerados entre dois backups agendados e permite atingir zero RPO. No entanto, quando você habilita o CDP para cargas de trabalho críticas, pode haver problemas de desempenho ou estabilidade, pois ele utiliza mais recursos. Por estas razões, o CDP é amplamente utilizado para backups em nível de arquivo.
A proteção de dados quase contínua pode ser definida como quase zero e executada em intervalos regulares. Isso está próximo de alcançar o efeito do CDP e pode ser habilitado para executar backup/replicação em nível de imagem que usa tecnologia baseada em snapshot ou outra. A maioria das soluções de backup e recuperação de desastres do mercado permite atingir um RPO próximo de zero em menos de 15 minutos para seu sistema crítico.
Capacidades de recuperação instantânea
Sua empresa exige uma opção para atingir suas metas de RTO próximo de zero, que podem ser alcançadas por meio de recuperação instantânea.
Um dos recursos de recuperação instantânea que toda empresa precisa como parte de seu plano de backup e recuperação de desastres é a capacidade de inicializar instantaneamente a máquina de backup diretamente do armazenamento de backup como uma máquina virtual pronta para continuar suas operações comerciais.
Você pode iniciar imediatamente uma máquina no ambiente virtual a partir do backup mais recente ou de qualquer momento usando os dados de backup ainda no formato criptografado e compactado em seu armazenamento de backup. Agora você pode ter seu sistema crítico instalado e funcionando em poucos minutos e garantir a continuidade dos negócios enquanto atinge um RTO próximo de zero.
Com isso, você consegue minimizar o tempo de inatividade e todos os seus sistemas de missão crítica Tier 1 continuam a operar sem impacto nos negócios. Posteriormente, você poderá migrar a máquina virtual com inicialização instantânea para produção para recuperação permanente.
Recuperação granular
A função da recuperação granular em um plano de backup e recuperação de desastres desempenha um papel significativo. Ele fornece a capacidade de restaurar apenas os dados necessários.
Com esta opção, você pode restaurar seletivamente um arquivo ou item de aplicativo diretamente do backup. Se você excluiu acidentalmente um arquivo, poderá selecionar e restaurar facilmente esse arquivo específico. Além disso, você pode restaurar imediatamente um e-mail ou caixa de correio específica, em vez de precisar recuperar todo o banco de dados ou aplicativo. Agora você poderá atingir um RTO de alguns minutos. Isto economiza tempo e recursos, pois não é necessário restaurar uma máquina inteira todas as vezes para recuperar um item individual.
Replicação em tempo real com failover
A replicação em tempo real permite criar uma cópia exata de suas cargas de trabalho de produção em outro site e replicar frequentemente as alterações na máquina de réplica, configurando RPO próximo de zero.
Se a sua máquina de origem ficar indisponível devido a qualquer interrupção ou corrupção, você poderá executar imediatamente uma operação de failover que alterna perfeitamente as operações de produção para a sua máquina de réplica. Sem qualquer tempo de inatividade ou impacto, você poderá continuar suas operações comerciais e, ao mesmo tempo, cumprir suas metas de RTO próximo de zero. Nos casos em que o RTO e o RPO estão próximos de zero, você pode aproveitar as funcionalidades de replicação e failover e manter suas cargas de trabalho de produção sempre disponíveis.
Cópia externa para recuperação de desastres
Ninguém pode prever um desastre. Se houver uma falha completa do site, até mesmo seus backups locais ficarão inacessíveis e colocarão seu negócio em risco, sem conseguir recuperar seus dados.
Por esse motivo, é bom ter um plano de recuperação de desastres que permita criar uma cópia adicional do seu backup e armazená-lo em um local remoto, que pode ser um data center local ou uma nuvem pública. Com backups externos, você pode recuperar seu sistema em caso de desastre e atender facilmente aos objetivos de recuperação de sua empresa.
Defenda, restaure e repita
Os planos de backup e recuperação de desastres são uma parte extremamente importante para lidar com um cenário de desastre. Conforme discutido acima, um dos principais aspectos para garantir a continuidade das operações em caso de desastre é especificar corretamente as métricas de RTO e RPO em seu plano de backup e recuperação de desastres.
Decida os valores de RTO e RPO, implemente uma solução que atenda aos SLAs do seu negócio, como ferramentas de monitoramento de SLA, e mantenha seu negócio sempre disponível.