Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?

Логотип компании
Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?
Удивительный факт: большинство ИТ-специалистов относятся к резервному копированию достаточно консервативно. Ну что там может быть революционного?

Теневое копирование? Дедупликация? Быстрые, дорогие «горячие» – и медленные, но дешевые хранилища (стоимость за гигабайт) и т. п.? Но ведь резервирование и отказоустойчивость – это же разные технологии. Облака – да, могут обеспечить и то и другое, но зачем это мешать в одну кучу? Между тем те же специалисты охотно и активно используют новые технологии ИТ-трансформации и дешевеющие облачные сервисы, не задумываясь, что фактически с помощью облака решают сразу несколько задач, в том числе отказоустойчивости и резервирования.

Немного печальной статистики, большая ложка дегтя в бочке меда традиционного резервного копирования. В 2020 году независимая исследовательская компания провела опрос, в котором приняли участие 3000 ИТ-специалистов из 28 стран. Выяснилось, что только 63% заданий резервного копирования выполняются в срок и без ошибок, а 33% заданий восстановления данных завершаются с ошибками или не завершаются вообще.

И при этом перед любой компанией стоят задачи сохранности данных/информации, обеспечения отказоустойчивости с необходимым минимальным временем простоя и защиты от угроз, в частности различных видов вирусной активности, в том числе так называемых вымогателей-шифровальщиков. Например, по данным исследования компании Forester, основные причины сбоев и простоя бизнеса следующие:

Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?. Рис. 1

С учетом новых вызовов нашего времени:– взрывного роста количества сотрудников на удаленном режиме работы при постоянно возрастающем количестве и сложности атак на системы безопасности – ИТ-службы находятся в постоянно сжимающихся тисках ограниченности ресурсов (времени, бюджета, кадровых), а также требований к непрерывности бизнес-процессов. Поэтому непрерывность работы компании и защита данных стали главными приоритетами. Проблемы растут, медлить нельзя.

В недавно проведенном опросе 1500 ИТ-специалистов по всему миру было озвучено пять основных причин, которые заставляют задуматься о модернизации традиционных методов и решений резервного копирования:

  1. «Мое текущее решение для резервного копирования ненадежно».

  2. «Если просуммировать все, что вы платите, в итоговой строке может получиться слишком большая сумма».

  3. «Заявленная окупаемость инвестиций (ROI) никогда не реализуется».

  4. «Восстановление данных занимает много времени, а окно резервного копирования слишком большое».

  5. «Это занимает слишком много моего времени и ресурсов».

Компания Veeam так обобщила эти доводы, вынуждающие потребителей используемые решения:

  1. Ненадежность.

  2. Слишком высокая стоимость.

  3. Проблемы с окупаемостью инвестиций.

  4. Медленное восстановление.

  5. Нехватка времени и ресурсов.

При этом современным компаниям для успешного развития и обслуживания ИТ-инфраструктур и сервисов также важно уметь интегрировать ИT-ресурсы в офисе и облаке и эффективно распределять ИТ-сервисы по нескольким облачным платформам с сохранением их логической целостности.

Выбирая тот или иной инструмент или решение, мы сталкиваемся с необходимостью предусмотреть многочисленные сценарии, которые, с одной стороны, обеспечат требования безопасности и отказоустойчивости, а с другой позволят развивать ИТ-сервисы с необходимой скоростью. Как всегда, на чаше весов несколько противоречивых требований. И задача ИТ – провести тщательный анализ и найти необходимый баланс при выборе решений – осложняется тем, что технологии стремительно развиваются, обеспечивая с опережением необходимый уровень развития кампаний и цифровой трансформации. И, казалось бы, только вчера купленное совсем недешевое, но такое «железное» решение с дорогими сердцу и кошельку ленточными или многодисковыми устройствами уже утром не обеспечивает новые сценарии резервирования и модернизации. С одной стороны, экспоненциально растут обрабатываемые и резервируемые объемы информации, пухнут базы данных, разработчики требуют космической скорости развития сервисов, с другой – бизнес требует 100%-ной сохранности и нулевого времени простоя, но с возможностью быстрой миграции нагрузок и данных между платформами и провайдерами.

Согласно результатам опроса, 50% средних и крупных компаний не могут продолжать функционировать в случае, когда ИТ-системы недоступны более часа. Если важна непрерывносьбя работы ИТ-системы, а простой несет большие потери, крайне важно найти сбалансированное решение и план аварийного восстановления.

Отличия обычного резервного копирования и сценариев резервирования

В чем различия

Backup

Disaster recovery / «Резервный ЦОД»

Требования к хранению

Данные копируются с определенной частотой (ежедневно, еженедельно, ежемесячно)

Репликация данных происходит непрерывно в режиме реального времени

Возможность восстановления данных

Восстановление только потерянной информации

Процесс переключения основной инфраструктуры компании на альтернативную

Потребности в дополнительных ресурсах

Необходимо только место в хранилище данных

Является полной или частичной копией ИТ-инфраструктуры компании, включая физические ресурсы, программное обеспечение и т. д.

Планирование отказоустойчивости

Не является инструментом обеспечения отказоустойчивости, так как не обеспечивает резервирование самой инфраструктуры

Это главный параметр DR. Реконфигурация сети автоматизирована, и включает в себя, при необходимости, замену IP-адресов, позволяет оперативно получить доступ к приложению и данным на резервной площадке и продолжить работу.

Результат

Копия данных

Работающая копия ИТ-системы на резервном сервисе

Но у большинства опрошенных выбор с учетом требований, возможностей и бюджета решения вызывает сложности. На первом этапе надо сравнить традиционное резервное копирование со сценариями резервирования и определить, какое решение обеспечит требования бизнеса.

Отличия обычного резервного копирования и сценариев резервирования

Размер бизнеса

< 1 минуты

до 1 часа

до 1 дня

несколько дней

Малый

17%

9%

45%

28%

Средний

30%

20%

21%

29%

Крупный

28%

22%

31%

19%

Виды и параметры резервирования

Для оценки необходимого уровня резервирования и отказоустойчивости ИТ-сервисов используются три основных параметра, которые определяются требованиями и существенно влияют на стоимость любого решения:

  • RTO (Recovery time objective) – время, за которое возможно восстановить ИТ-систему.

  • RPO (Recovery point objective) – сколько данных будет потеряно при аварийном восстановлении.

  • RCO (Recovery capacity objective) – какую часть нагрузки должна обеспечивать резервная система (может измеряться в процентах, транзакциях ИТ-систем и других величинах).

Для поиска оптимального решения можно использовать простую логику: оценить и соотнести стоимость простоя и стоимость решения:

Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?. Рис. 2

Для решения этих сложных и противоречивых задач воспользуемся проверенной методикой типизации и упрощения сценариев, разбив их на три основные группы, в каждой из которых предпочтителен тот или иной подход. В результате несложных обобщений получаем три варианта, которые самостоятельно или в комбинации решают свыше 90% задач резервирования:

  1. «Холодный» резерв – для репликации и резервного копирования любых данных в удаленное облачное хранилище.

  2. «Теплый» резерв – полнофункциональная резервная или вспомогательная площадка на случай прекращения работоспособности основной площадки или временного расширения нагрузки.

  3. «Горячий» резерв – решение с максимальным уровнем отказоустойчивости информационных систем или отдельных решений.

«Холодный» резерв простейшем виде может быть обычным резервным копированием с необходимой глубиной хранения.

ПРИМЕР:

Офисная инфраструктура через site-to-site VPN подключается к облачной. Настраиваются правила резервного копирования (перечень ресурсов, периодичность, глубина и т. п.). В случае потери данных в офисе они будут гарантированно восстановлены из географически удаленного ЦОДа (в том числе в случае катастрофы).

Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?. Рис. 3

«Холодный» резерв

«Теплый» резерв может быть организован на основе быстрого резервного копирования с минимально возможным временем потери и восстановления информации и состояния системы. Это может быть «горячий» резерв только части сервисов, например базы данных или иных систем в режиме репликации без активного использования вычислительных мощностей (процессоров и памяти). Важно решить, какую часть нагрузки должна обеспечивать резервная система и, если необходимо, возможное время развертывания резервной площадки на полную или частичную мощность.

Читайте также
Какие методы обнаружения deepfake существуют? Какие возможности могут предоставить большие языковые модели (LLM) для генерации и обнаружения дипфейков? Расскажем о технологии aIDeepfake для борьбы с фальсифицированным контентом.

ПРИМЕР:

Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?. Рис. 4

«Теплый» резерв

«Горячий» резерв может совмещать максимальную отказоустойчивость, геораспределенность и балансировку нагрузки как на уровне приложений, так и на платформенном уровне: уровне операционных систем и систем хранения.

ПРИМЕРЫ:

Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?. Рис. 5

Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?. Рис. 6

Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?. Рис. 7

Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?. Рис. 8

«Горячий» резерв/геокластер

Что выбрать?

Выбирая золотую середину, мы фактически удовлетворяем приоритеты: допустимое время простоя, риски, бюджет решения и, что сейчас все более важно, – необходимую гибкость решения. Это должно обеспечить развитие ИТ-сервисов за минимально возможное время и вероятную смену приоритетов, так как, например, самый сложный и дорогой сценарий «горячего» резервирования благодаря стремительному развитию облачных технологий сейчас становится невероятно доступнее.

Как подсказывает практика, в большинстве случаев решения с использованием «теплого» резервирования с обычным резервным копированием позволяют решить большинство задач обеспечения необходимого баланса между требованиями минимального времени простоя, необходимой глубины хранения и версионности, бюджета и запаса гибкости.

На рынке сегодня большое количество узкоспециализированных и достаточно универсальных решений. С целью экономии и упрощения можно выбрать, например, универсальные продукты от Veeam или решать эти задачи дискретно, с учетом специфики и/или требований обеспечения более глубокого уровня решения. При выборе важно избежать лишних затрат и сложностей, связанных с созданием и сопровождением собственной резервной площадки, но при этом обеспечить минимальную потерю данных и быстрое восстановление в случае сбоя основной площадки.

Итак, фокусируемся на следующих основных требованиях:

  • Быстрое развертывание. Решение не должно быть слишком сложным и/или подключение и настройка сервиса осуществляются в кратчайшие сроки специалистами провайдера.

  • Сокращение затрат на инфраструктуру. Решение должно позволять сократить расходы на развертывание, мониторинг и поддержку резервной площадки с оплатой только использования сервиса и используемых ресурсов по фактическому потреблению.

  • Минимально возможное время простоя и потери данных благодаря надежному восстановлению и частоте реплик.

Давайте сравним решения от Veeam и VMware на примере сервисов для задач «холодного» и «теплого» резервирования, а также миграции между площадками, платформами и даже провайдерами.

С помощью Veeam Cloud Connect можно настроить непрерывную репликацию в облако и быстро переключиться на реплику в случае аварии на основной площадке. Все операции выполняются в Veeam Backup and Replication. Этот сервис подходит лучше всего в следующих случаях:

  • Для построения полноценной резервной площадки с минимальными затратами.

  • Для оперативного восстановления работоспособности ИТ-сервисов в случае сбоя.

  • Необходимо реплицировать виртуальные машины на VMware и Hyper-V.

  • Необходимо делать дополнительные копии бэкапа в облаке, например, по схеме «3-2-1».

  • Если уже используется Veeam Backup and Replication.

Преимущества:

  • Поддержка работы с VMware, MS Hyper-V, Nutanix AHV и решения Veeam Agent для Linux.

  • Централизованное решение для управления резервным копированием и репликацией на объединяемых площадках.

  • Независимый портал управления может находиться в надежном облаке провайдера.

  • Возможность использовать сжатие трафика, особенно при использовании интернет-каналов со слабой пропускной способностью.

  • Возможность настраивать очередность запуска виртуальных машин в случае сбоя основной площадки.

  • Поддержка работы с VMware vCloud Director.

  • Минимальное время потери данных – от 1 минуты.

Сценарии использования:

  • Резервное копирование данных из офисной инфраструктуры в ЦОД/облако.

  • Аварийное восстановление из офисной инфраструктуры в облако.

  • Аварийное восстановление между ЦОДами/облаками.

VMware vCloud Availability позволяет осуществлять аварийное восстановление и миграцию виртуальных машин между различными площадками виртуализации инфраструктуры, например из офисной инфраструктуры в облако провайдера. С помощью vCloud Availability можно настраивать параметры репликации и восстановления для каждой виртуальной машины. В случае падения основной площадки виртуальные машины будут запущены в облаке.

Этот сервис предпочтителен в следующих случаях:

  • Построение полноценной резервной площадки с минимальными затратами.

  • Нужна возможность оперативного восстановления систем в случае сбоя.

  • При необходимости построения гибридного облака с возможностью автоматической миграции ВМ в облако.

  • Уже используется виртуализация Vmware.

Преимущества:

  • Интеграция с порталом vCloud Director.

  • Настройка заданий миграции и репликации.

  • Выбор политики хранения данных.

  • Возможность изменения сетевых настроек на резервной площадке.

  • Возможность тестирования.

  • Мониторинг выполнения заданий репликации.

  • Поддержка создания точек восстановления.

  • Минимальное время потери данных – от 5 минут.

Сценарии использования:

  • Миграция ресурсов из офисной инфраструктуры в облако и обратно в любой момент.

  • Построение гибридной облачной инфраструктуры за считаные минуты.

  • Аварийное восстановление из офисной инфраструктуры в облако.

  • Аварийное восстановление между двумя ЦОДами в облаке.

Сравнение Veeam Cloud Connect и VMware vCloud Availability

Функции

Veeam Cloud Connect

vCloud Availability

Настройка RPO

От 1 мин

От 5 мин

Единая сеть L2

Нет

Да

Безопасность

SSL/TLS-канал

SSL/TLS-канал

Поддерживаемые платформы виртуализации

VMware, Hyper-V

VMware

Простота установки

Инфраструктура Veeam B&R

Одна служебная ВМ на стороне заказчика

Требуются дополнительные сервисы управления миграцией

Да (сервер+агенты на каждую ВМ)

Да

Требуются дополнительные лицензии

Да
(Veeam B&R)

Нет

Требуется совместимость версии vSphere

Нет

Да

Требуется создание сервисов и инфраструктуры с нуля

Нет

Нет

Варианты использования

On-premise <-> Cloud DR
On-premise <-> Cloud Backup
Cloud <-> Cloud DR

On-premise <-> Cloud DR
Cloud <-> Cloud DR

Репликация изменённых данных ВМ

Да

Да

Холодная миграция

Да

Да

Горячая миграция

Да

Да

Миграция без доступа к системе виртуализации

Да

Нет

Миграция железных серверов

Да

Нет

Дополнительные траты на сервис для заказчика

Да: лицензии Veeam. Работы опционально

Нет

Заключение и выводы

Если обобщить основные потребности, получаем следующую статистику требований к новым решениям резервирования:

  1. Повышение надежности (количества успешных завершений) резервного копирования на 39%.

  2. Снижение затрат на ПО или оборудование на 38%.

  3. Повышение окупаемости инвестиций (ROI) / снижение совокупной стоимости владения (TCO) на 33%.

  4. Улучшение показателей RPO/RTO на 30%.

  5. Снижение сложности эксплуатации (например, простота использования) на 30%.

Какой сценарий выбрать: «теплый», «холодный» или «горячий» резерв?. Рис. 9

Новое решение для резервирования должно:

  • работать по принципу «настроил и забыл», вселяя уверенность, что данные в нужный момент будут восстановлены;

  • иметь простую и гибкую ценовую модель и быть совместимым со всем используемым оборудованием и хранилищами;

  • предусматривать бесплатный тестовый период;

  • иметь различные варианты восстановления для соответствия требованиям любых SLA;

  • быть инновационным и иметь подтвержденные примеры успешного использования заказчиками;

  • не должно занимать много времени на его изучение и внедрение, позволяя ИТ-специалистам сосредоточиться на других задачах и приоритетах.

Практически все эти требования отлично сочетаются в решении «Резервный DC/ЦОД», которое может быть построено на сервисах Veeam или vCloud Availability.

Резервный/вспомогательный ЦОД должен обеспечивать:

  • аварийное восстановление и репликацию данных;

  • защиту от рисков и связанных с ними убытков;

  • возможность оперативно восстановить данные;

  • размещение в отказоустойчивых ЦОДах Tier III;

  • тарификацию только за реально использованные ресурсы.

В зависимости от требований и бюджета может быть организована репликация всей ИТ-инфраструктуры («горячий» резерв) или ограниченная/минимальная по виртуальным мощностям инфраструктура, например в режиме вспомогательного и резервного DC/ЦОДа («теплый» или «холодный» резерв).

В облаке размещается резервная или вспомогательная ИТ-инфраструктура, а основная – на площадке заказчика или в другом облаке.

Решение «Резервный/вспомогательный ЦОД» проще, безопасней и выгодней размещать в облаке надежного провайдера, где оно успешно используется в следующих вариантах работы:

  • «Холодный», «теплый» и «горячий» резерв, резервный ЦОД с запуском по требованию. В случае отказа основной площадки приложения и сервисы автоматически запускаются на другой (обеспечение непрерывности бизнеса).

  • Решение вспомогательных задач: тестовые площадки под новые проекты, среды для разработки, кросс-миграция между ИТ-площадками для целей модернизации и оптимизации ПО и аппаратного обеспечения, масштабирование вычислительных ресурсов при пиковой нагрузке, эластичные ИТ, быстрое развертывание дополнительных сервисов и рабочих мест.

  • Резервный ЦОД с гибридной и комбинированной инфраструктурой – оптимальное решение для крупных ИТ-инфраструктур, часто используемое в комбинации с услугами Dedicated и Colocation.

Опубликовано 15.09.2021

Похожие статьи