Wdrożenie Polcom Disaster Recovery dla klienta z branży wysokiej jakości artykułów spożywczych
- Karolina Wierzbic
Wdrożenie Polcom Disaster Recovery dla klienta z branży wysokiej jakości artykułów spożywczych
Producent wysokiej jakości artykułów spożywczych, wyspecjalizowany w obsłudze sektora retail oraz HoReCa, z ugruntowaną obecnością na rynkach międzynarodowych.
Kluczowa usługa:
- Polcom Disaster Recovery
Wykorzystane technologie:
- Systemy operacyjne: Windows Server DataCenter, SUSE Linux Enterprise Server (SLES)
- Wirtualizator Hyper-V
- Hyper-V Replica
- Bazy danych Oracle oraz Microsoft.
Udostępnione zasoby:
- Serwery dedykowane
- VPN S2S
- Usługa zarządzania systemem Windows/Linux
- Licencje Windows i SUSE Linux Enterprise Server (SLES)
- Usługa zarządzania oraz serwisowania serwerami fizycznymi.
Cel projektu:
Celem projektu było stworzenie kompleksowego środowiska Disaster Recovery, umożliwiającego zapewnienie ciągłości działania kluczowych systemów i procesów biznesowych klienta w przypadku wystąpienia poważnej awarii lub niedostępności podstawowej infrastruktury IT. Założeniem wdrożenia było przygotowanie niezależnego środowiska zapasowego, pozwalającego na szybkie przełączenie usług do zapasowych lokalizacji oraz ograniczenie ryzyka długotrwałych przestojów operacyjnych.
Istotnym elementem projektu było również wdrożenie mechanizmów replikacji danych i maszyn wirtualnych, umożliwiających bieżącą synchronizację środowiska produkcyjnego z infrastrukturą zapasową. Dzięki temu możliwe stało się znaczące skrócenie czasu uruchomienia usług po awarii oraz ograniczenie potencjalnej utraty danych do minimum.
Zakres projektu:
Projekt obejmował przygotowanie oraz wdrożenie dedykowanego środowiska Disaster Recovery, którego zadaniem było przejęcie obsługi kluczowych systemów klienta w przypadku wystąpienia awarii infrastruktury podstawowej znajdującej się w lokalizacji klienta. W ramach realizacji założeń projektowych dostarczono dwa serwery fizyczne pełniące rolę infrastruktury zapasowej, przygotowane do uruchomienia środowiska produkcyjnego w scenariuszu awaryjnym. Parametry fizyczne dopasowane w taki sposób aby w przypadku przełączenia się do środowiska zapasowego nie zanotowano spadków wydajnościowych.
Rozwiązanie zostało zaprojektowane indywidualnie (projektowo), z uwzględnieniem specyfiki systemów klienta, parametrów wydajnościowych środowiska produkcyjnego oraz wymagań w zakresie dostępności usług i czasu odtworzenia (RTO/RPO). Polcom odpowiadał za przygotowanie architektury, dobór komponentów infrastrukturalnych oraz budowę kompletnego środowiska DR.
W ramach projektu dostarczono również niezbędne licencje Windows Server Datacenter wymagane do prawidłowego działania serwerów fizycznych, platformy wirtualizacyjnej oraz maszyn wirtualnych funkcjonujących w środowisku zapasowym. Dzięki temu klient otrzymał w pełni przygotowane środowisko, umożliwiające realizację procedur odtworzeniowych bez konieczności angażowania dodatkowych zasobów po swojej stronie.
W warstwie technologicznej zastosowano replikację maszyn wirtualnych oraz przygotowano środowisko pod mechanizmy replikacji środowisk bazodanowych, co zapewniło bieżącą synchronizację danych pomiędzy środowiskiem produkcyjnym a infrastrukturą Polcom. Takie podejście pozwoliło ograniczyć ryzyko utraty danych oraz znacząco skróciło czas przywrócenia działania systemów po wystąpieniu incydentu.
Komunikacja pomiędzy środowiskiem klienta a infrastrukturą zapasową została zrealizowana w oparciu o redundantny dostęp do Internetu po stronie Polcom oraz wysokowydajne urządzenie klasy firewall po stronie klienta. Połączenie zostało zestawione w formie szyfrowanego tunelu VPN Site-to-Site, zapewniającego bezpieczną transmisję danych wykorzystywanych w procesach replikacji oraz stałą komunikację pomiędzy lokalizacjami.
Środowisko techniczne:
Architektura środowiska Disaster Recovery została oparta na dwóch dedykowanych serwerach fizycznych wyposażonych w procesory serii Platinum, pełniących odrębne role w zakresie zabezpieczenia systemów klienta. 32-rdzeniowe procesory zapewniają wysoką wydajność w obciążeniach wielowątkowych oraz bazową częstotliwość taktowania nie niższą niż 2,6 GHz. Taki podział pozwolił na optymalizację wydajności, dopasowanie mechanizmów replikacji do charakterystyki obciążeń oraz zapewnienie elastyczności w dalszym rozwoju infrastruktury.
Pierwszy serwer, wyposażony w dwa procesory oraz odpowiednio dobraną pamięć RAM 1 TB, został przeznaczony wyłącznie do obsługi środowiska bazodanowego. Wykorzystano w nim wydajne zasoby dyskowe zapewniające odpowiednią klasę wydajności. Zastosowano replikację bazodanową umożliwiającą ciągłą synchronizację zmian zgodnie z wymaganymi parametrami RPO, wynoszącymi 5 minut, co pozwala na minimalizację utraty danych oraz utrzymanie wysokiej dostępności systemów.
Drugi serwer, wyposażony w dwa procesory oraz pamięć RAM 2TB, został przeznaczony do tego aby realizować najbardziej wymagające scenariusze projektowe. Został objęty licencją Windows Server Datacenter, co umożliwia uruchamianie nielimitowanej liczby maszyn wirtualnych w scenariuszu awaryjnym oraz wykorzystanie natywnych mechanizmów replikacyjnych ekosystemu Microsoft. Przestrzeń dyskowa dla środowiska wirtualnego została udostępniona z infrastruktury Polcom Cloud, co pozwala na elastyczne zarządzanie zasobami i ich skalowanie zgodnie z potrzebami klienta.
Część maszyn wirtualnych pracuje w trybie ciągłym, co jest wymagane dla poprawnego działania mechanizmów replikacji bazodanowej, w tym rozwiązań takich jak Log Shipping. Całość środowiska została zaprojektowana tak, aby umożliwić przejęcie funkcjonalności zarówno maszyn wirtualnych, jak i serwerów fizycznych po stronie klienta, przy zachowaniu wymaganych parametrów wydajnościowych oraz ciągłości działania usług.
Zakres systemów objętych ochroną, ich kolejność uruchamiania oraz scenariusze przełączeń awaryjnych pozostają po stronie klienta, co pozwala na pełne dopasowanie modelu DR do potrzeb biznesowych użytkownika końcowego. Polcom zapewnia elastyczność operacyjną, umożliwiając szybkie dostosowanie konfiguracji środowiska do wyników testów, zmian architektury lub rodzaju incydentu.
W celu optymalizacji procesu inicjalnej replikacji danych przewidziano możliwość czasowego zwiększenia przepustowości łącza, co umożliwia sprawne przeprowadzenie pierwszej synchronizacji dużych wolumenów danych bez wpływu na bieżącą pracę systemów produkcyjnych. Architektura rozwiązania uwzględnia również możliwość dalszej rozbudowy, w tym integracji z istniejącym środowiskiem backupowym klienta, co w przyszłości pozwoli na wykorzystanie kopii zapasowych jako dodatkowej ścieżki odtwarzania systemów i danych.
Osiągnięty efekt:
Wdrożenie środowiska Disaster Recovery opartego na dwóch serwerach fizycznych, wykorzystujących replikację na poziomie Hyper-V oraz baz danych, pozwoliło na istotne podniesienie poziomu dostępności i odporności infrastruktury IT klienta na awarie.
Zastosowane mechanizmy zapewniają bieżącą synchronizację zarówno maszyn wirtualnych, jak i danych aplikacyjnych pomiędzy środowiskiem produkcyjnym a zapasowym, co znacząco ogranicza ryzyko utraty informacji oraz minimalizuje opóźnienia w ich odtworzeniu.
W przypadku wystąpienia awarii jednego z elementów infrastruktury możliwe jest szybkie przełączenie usług na środowisko zapasowe, bez konieczności długotrwałej rekonfiguracji systemów. Dzięki temu zachowana zostaje ciągłość działania kluczowych procesów biznesowych klienta.
Dodatkowa warstwa replikacji baz danych zwiększa spójność przetwarzanych informacji oraz wzmacnia bezpieczeństwo danych, redukując potencjalne straty do poziomu zgodnego z założonymi parametrami RPO (Recovery Point Objective – określa maksymalny dopuszczalny poziom utraty danych wyrażony w czasie) i RTO (Recovery Time Objective – określa maksymalny akceptowalny czas niedostępności systemu po awarii).
Rozwiązanie Polcom Disaster Recovery pozwoliło na istotne skrócenie czasu odtworzenia usług po awarii oraz zapewniło środowisko spełniające wymagania wysokiej dostępności (HA), zgodnie z założeniami Business Continuity Plan.