RTO kontra RPO: dlaczego cele odzyskiwania mają znaczenie dla sukcesu IT
Opublikowany: 2023-09-07Firmy mają świadomość, że przestoje IT będą kosztować więcej.
Firmy muszą rozważyć konsekwencje przestojów i skoncentrować się na utrzymaniu ciągłości operacji biznesowych. Aby to osiągnąć, należy wdrożyć odpowiedni plan ciągłości działania, który pozwoli zminimalizować przestoje lub całkowicie ich uniknąć. W ten sposób firmy mogą zapewnić odporność swojej infrastruktury IT.
Omawiając przestoje w działalności biznesowej, często słyszy się o celach związanych z czasem odzyskiwania (RTO) i celami punktu odzyskiwania (RPO). Dla każdej firmy niezwykle ważne jest pełne zrozumienie RTO i RPO, aby zapewnić szybkie przywrócenie działania po awarii.
RTO vs. RPO – jaka jest różnica?
RTO to pożądany limit przestoju po awarii, wskazujący, jak szybko należy przywrócić systemy. Natomiast RPO to akceptowalny limit utraty danych, pokazujący, ile danych system może sobie pozwolić na utratę.
Wybór odpowiedniego oprogramowania do odzyskiwania po awarii w formie usługi (DRaaS) umożliwia firmom wdrażanie wydajnych rozwiązań, które spełniają cele RTO i RPO przy minimalnej utracie danych.
W tym artykule omówimy, jak mierzyć RTO i RPO, rolę tych wskaźników w zapasowym planie ciągłości działania oraz jak definiować i osiągać cele RTO i RPO w Twojej firmie.
Jaki jest docelowy czas odzyskiwania (RTO)?
Docelowy czas odzyskiwania (RTO) to kluczowy wskaźnik, który pomaga obliczyć, jak szybko system lub aplikacja musi zostać przywrócona po przestoju, aby nie miało to znaczącego wpływu na działalność biznesową. Krótko mówiąc, RTO to miara tego, ile przestojów możesz tolerować.
W przypadku nieoczekiwanych przestojów jeden lub dwa systemy mogą ulec awarii, a Ty będziesz musiał czekać na przestoje, dopóki problem nie zostanie rozwiązany. Stawia to Cię w sytuacji, w której musisz określić czas, w którym musisz przywrócić system, aby Twoja działalność biznesowa nie została zakłócona. I tu z pomocą przychodzi RTO.
Zdefiniowanie RTO obejmuje zrozumienie tolerancji przestojów każdego systemu, a dla każdej aplikacji prawdopodobnie będziesz mieć różne RTO. Po zdefiniowaniu wskaźnika RTO można przystąpić do planowania odzyskiwania, które obejmuje strategię odzyskiwania i technologię niezbędną do pomyślnego i szybkiego przywracania systemu po przestoju.
Jaki jest cel punktu odzyskiwania (RPO)?
Cel punktu przywracania (RPO) to wyznaczona przez Ciebie miara określająca ilość utraty danych, jaką Twoja firma może ponieść i kontynuować funkcjonowanie bez żadnego wpływu na jej działalność.
Aby określić RPO, należy ocenić krytyczność danych i wiedzieć, czy należy odzyskać wszystkie dane, czy tylko ich część. Mogą nawet istnieć dane, które są stosunkowo mniej istotne i nie wymagają przywracania. Na tej podstawie będziesz mógł zdefiniować RPO dla swojego systemu: im wyższa krytyczność danych, tym mniejsza powinna być wartość RPO.
Określenie RPO jest istotną częścią planu tworzenia kopii zapasowych, ponieważ pomaga określić częstotliwość tworzenia kopii zapasowych danych w oparciu o ich krytyczność.
Różnice między RTO i RPO
RTO i RPO to ważne elementy związane z planami tworzenia kopii zapasowych i odzyskiwania po awarii. Zarówno RTO, jak i RPO są definiowane i mierzone w jednostkach czasu. Chociaż RTO i RPO mogą brzmieć podobnie, istnieją pewne zasadnicze różnice:
Docelowy czas odzyskiwania (RTO) | Cel punktu odzyskiwania (RPO) |
Dotyczy tolerowanego czasu przestoju do czasu powrotu do zdrowia. | Związane z tolerowaną utratą danych. |
Związane z czasem potrzebnym na przywrócenie. | Związane z częstotliwością tworzenia kopii zapasowych. |
Związane z przywróceniem normalnego stanu przy użyciu najnowszych danych. | Dotyczy tego, jak będą wyglądać najnowsze odzyskane dane. |
Koncentruje się na technologiach odzyskiwania wymaganych do osiągnięcia celów, w tym przywrócenia całego systemu lub tylko aplikacji lub na bardziej szczegółowym poziomie. | Skoncentrowany na automatyzacji tworzenia kopii zapasowych systemu w odpowiednich odstępach czasu. |
RTO vs. RPO: Jak zminimalizować przestoje w biznesie
Przestoje IT mają wiele przyczyn, takich jak awarie systemu, awarie sieci lub aplikacji, utrata danych w wyniku ataku oprogramowania ransomware lub awarie witryn spowodowane klęskami żywiołowymi. Jeśli wydarzy się którekolwiek z wyżej wymienionych nieprzewidzianych zdarzeń, może to zatrzymać Twoje procesy i może Cię kosztować więcej.
Aplikacje są najważniejsze i muszą być zawsze dostępne. Awaria krytycznej aplikacji w Twojej firmie prowadzi do przerwy w działaniu aplikacji, a także powoduje utratę danych. Ma to bezpośredni wpływ na działalność biznesową zarówno w perspektywie krótko-, jak i długoterminowej oraz wpływa na produktywność, przychody i markę. W skrajnych przypadkach może to nawet spowodować upadłość firmy.
Tolerancja przestojów aplikacji może się różnić w zależności od branży, ale najważniejszym czynnikiem jest tutaj ograniczenie przestojów poprzez szybkie przywrócenie dostępności aplikacji.
Aby móc szybko uruchomić systemy, każda firma musi posiadać solidną strategię ochrony danych, czyli plan tworzenia kopii zapasowych i odzyskiwania danych po awarii. Wybierając plan tworzenia kopii zapasowych i odzyskiwania po awarii dla swojej firmy, powinieneś poszukać rozwiązania, które oferuje krótsze RTO i RPO. Pozwala to osiągnąć minimalne przestoje i zapewnić ciągłość działania poprzez przywrócenie systemu w razie potrzeby.
Ryzyko ignorowania wskaźników RTO i RPO
Wskaźniki RTO i RPO pomogą Ci zminimalizować ryzyko związane z przestojami, jeśli prawidłowo je ocenisz i zdefiniujesz. Wskaźniki te powinny być zgodne z celami odzyskiwania danych biznesowych i zarządzaniem umowami dotyczącymi poziomu usług (SLA).
Jeśli nie zdefiniujesz prawidłowo RTO i RPO, może to prowadzić do dowolnego poziomu ryzyka, od mniejszego do poważnego. Dodatkowo nie będzie można przywrócić danych z wymaganego momentu, co może skutkować utratą danych i przerwaniem procesów biznesowych. Co więcej, nie będziesz w stanie uruchomić systemu w wymaganym czasie.
W obu przypadkach wymienionych powyżej przerwa w działalności może prowadzić do utraty produktywności. W najgorszych przypadkach doprowadzi to do utraty przychodów i może spowodować poważne konsekwencje, takie jak utrata reputacji biznesowej.
Jak osiągnąć RTO i RPO dzięki planowi tworzenia kopii zapasowych i odzyskiwania po awarii
Wszelkie rozwiązania do tworzenia kopii zapasowych i odzyskiwania po awarii, na które się zdecydujesz, będą określać gwarantowane RPO i RTO w umowie SLA. Zawsze upewnij się, że wybrane rozwiązanie do tworzenia kopii zapasowych i odzyskiwania po awarii zapewnia osiągnięcie celów odzyskiwania: RTO i RPO.
Rozwiązania do tworzenia kopii zapasowych i odzyskiwania po awarii oferują wiele funkcji pozwalających osiągnąć cele biznesowe RTO i RPO. Przyjrzymy się niektórym ważnym funkcjom, których należy szukać w rozwiązaniu do tworzenia kopii zapasowych i odzyskiwania po awarii, które pomoże Twojej firmie osiągnąć niemal zerowe RTO i RPO.
Elastyczne zasady planowania
Dzisiejsze rozwiązania do tworzenia kopii zapasowych i odzyskiwania po awarii oferują elastyczne zasady planowania w celu zdefiniowania RPO dla Twoich aplikacji. Zasady planowania umożliwiają uruchamianie automatycznego tworzenia kopii zapasowych w regularnych odstępach czasu, np. co kilka minut, co kilka godzin lub raz dziennie. Dzięki temu wdrożenie RPO jest znacznie łatwiejsze.
Ciągła ochrona danych (CDP) gwarantuje, że za każdym razem, gdy w systemie/aplikacji zostaną wprowadzone zmiany, zostanie natychmiast utworzona ich kopia zapasowa lub replikowana. Rozwiązuje to problem, w przypadku którego firmy ryzykują utratę danych generowanych pomiędzy dwiema zaplanowanymi kopiami zapasowymi, i pozwala osiągnąć zerowy RPO. Jednak po włączeniu protokołu CDP dla obciążeń krytycznych mogą wystąpić problemy z wydajnością lub stabilnością, ponieważ wykorzystuje więcej zasobów. Z tych powodów protokół CDP jest powszechnie stosowany do tworzenia kopii zapasowych na poziomie plików.
Prawie ciągłą ochronę danych można ustawić na wartość bliską zeru i uruchamiać ją w regularnych odstępach czasu. Jest to zbliżone do efektu CDP i można je włączyć w celu wykonywania kopii zapasowych/replikacji na poziomie obrazu przy użyciu technologii opartej na migawkach lub innej. Większość dostępnych na rynku rozwiązań do tworzenia kopii zapasowych i odzyskiwania danych po awarii umożliwia osiągnięcie niemal zerowego RPO w czasie krótszym niż 15 minut dla krytycznego systemu.
Możliwość natychmiastowego odzyskiwania
Twoja firma potrzebuje opcji umożliwiającej osiągnięcie niemal zerowych celów RTO, które można osiągnąć poprzez natychmiastowe odzyskanie danych.
Jedną z funkcji natychmiastowego odzyskiwania, której potrzebuje każda firma w ramach planu tworzenia kopii zapasowych i odzyskiwania po awarii, jest możliwość natychmiastowego uruchomienia maszyny, której kopia zapasowa została utworzona bezpośrednio z magazynu kopii zapasowych, jako maszyny wirtualnej w stanie gotowości, aby móc kontynuować działalność biznesową.
Możesz natychmiast uruchomić maszynę w środowisku wirtualnym z najnowszej kopii zapasowej lub w dowolnym momencie, korzystając z danych kopii zapasowych znajdujących się nadal w zaszyfrowanym i skompresowanym formacie w magazynie kopii zapasowych. Możesz teraz uruchomić swój krytyczny system w ciągu kilku minut i zapewnić ciągłość działania, zachowując niemal zerowy RTO.
Dzięki temu możesz zminimalizować przestoje, a wszystkie systemy o znaczeniu krytycznym poziomu 1 będą nadal działać bez wpływu na działalność firmy. Później możesz przenieść natychmiast uruchomioną maszynę wirtualną do wersji produkcyjnej w celu trwałego przywrócenia.
Odzyskiwanie granularne
Rola odzyskiwania granularnego w planie tworzenia kopii zapasowych i odzyskiwania po awarii odgrywa znaczącą rolę. Zapewnia możliwość przywrócenia tylko tych danych, których potrzebujesz.
Dzięki tej opcji możesz selektywnie przywrócić plik lub element aplikacji bezpośrednio z kopii zapasowej. Jeśli przypadkowo usunąłeś plik, możesz łatwo wybrać i przywrócić ten konkretny plik. Można także natychmiastowo przywrócić konkretną pocztę lub skrzynkę pocztową, bez konieczności odzyskiwania całej bazy danych lub aplikacji. Teraz będziesz w stanie osiągnąć RTO wynoszący kilka minut. Oszczędza to czas i zasoby, ponieważ nie jest konieczne przywracanie całej maszyny za każdym razem, aby odzyskać pojedynczy element.
Replikacja na żywo z przełączaniem awaryjnym
Replikacja na żywo umożliwia utworzenie dokładnej kopii obciążeń produkcyjnych w innej lokalizacji i częste replikowanie zmian na maszynę repliki, konfigurując niemal zerowy współczynnik RPO.
Jeśli maszyna źródłowa stanie się niedostępna z powodu awarii lub uszkodzenia, możesz natychmiast wykonać operację przełączenia awaryjnego, która płynnie przełączy operacje produkcyjne na maszynę repliki. Bez żadnych przestojów i skutków będziesz mógł kontynuować działalność biznesową, osiągając niemal zerowe cele RTO. W przypadkach, gdy zarówno RTO, jak i RPO są bliskie zeru, można wykorzystać funkcje replikacji i przełączania awaryjnego, utrzymując w ten sposób stałą dostępność obciążeń produkcyjnych.
Kopia poza siedzibą firmy do odzyskiwania po awarii
Nikt nie jest w stanie przewidzieć katastrofy. Jeśli wystąpi awaria całej witryny, nawet lokalne kopie zapasowe staną się niedostępne, co narazi Twoją firmę na ryzyko bez możliwości odzyskania danych.
Z tego powodu dobrze jest mieć plan odzyskiwania danych po awarii, który pozwala na utworzenie dodatkowej kopii zapasowej i przechowywanie jej w zdalnej lokalizacji, którą może być lokalne centrum danych lub chmura publiczna. Dzięki zewnętrznym kopiom zapasowym możesz odzyskać system w przypadku awarii i łatwo osiągnąć swoje cele biznesowe w zakresie odzyskiwania danych.
Broń, przywracaj i powtarzaj
Plany tworzenia kopii zapasowych i odzyskiwania po awarii są niezwykle ważnym elementem radzenia sobie ze scenariuszem katastrofy. Jak omówiono powyżej, jednym z głównych aspektów zapewnienia ciągłości działania w przypadku awarii jest prawidłowe określenie wskaźników RTO i RPO w planie tworzenia kopii zapasowych i odzyskiwania po awarii.
Zdecyduj się na wartości RTO i RPO, wdrażaj rozwiązanie, które spełnia Twoje biznesowe umowy SLA, takie jak narzędzia do monitorowania SLA, i zapewnij ciągłą dostępność swojej firmy.