Рубрика:
Администрирование /
Продукты и решения
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
ВИКТОР ОСЬМОВ, технический специалист ЗАО «НПП Родник» («золотой партнер» компании Stratus)
Технология Stratus everRun SplitSite
Стихийные бедствия или человеческие ошибки могут привести к полному отключению центра обработки данных и остановить работу информационных систем на несколько дней или даже недель. Кроме того, отключение всей площадки, как правило, сопровождается потерей или повреждением данных, дополнительно увеличивая ущерб и затраты на восстановление
Поэтому компании, занятые в таких требовательных к бесперебойной работе вычислительной инфраструктуры отраслях, как фармацевтика, производство и финансовые услуги, используют технологию защиты everRun SplitSite. Этогарантирует отсутствие отказов даже в случае масштабных катастроф. Но многие организации все еще откладывают внедрение решений для восстановления, опасаясь их высокой стоимости и требовательности к ресурсам, хотя на самом деле нет никаких причин продолжать подвергать себя такому риску.
Технология everRun SplitSite позволяет создать вычислительную среду, защищенную от проблем уровня здания за счет размещения своих физических узлов в территориально разделенных местах или центрах обработки данных. Использование everRun SplitSite позволяет в случае серьезной аварии на одной из площадок избежать перерыва в работе информационной системы без вмешательства персонала. Конфигурация SplitSite объединяет два физических узла вдвух географически разделенных сайтах и организует их синхронную репликацию.
Как и в конфигурации с размещением узлов в непосредственной близости друг от друга, в случае применения технологии SplitSite, everRun продолжает обнаруживать отказы дисковой и сетевой подсистемы и обеспечивает оба уровня защиты (высокую доступность HA и отказоустойчивость FT) виртуальных машин.
Для виртуальных машин с защитой FT everRun обеспечит нулевое время простоя даже при аварии на сайте и при полном выходе из строя одного из физических узлов системы. После ликвидации последствий аварии и восстановления работы сервера он будет автоматически синхронизирован с продолжавшим функционировать все это время вторым узлом.
Рисунок 1. Структурная схема конфигурации SplitSite
Требования SplitSite и лицензирование
Для успешного использования технологии требуется выполнить несколько условий.
Во-первых, увеличенное расстояние между узлами и применение дополнительных сетевых устройств на пути между ними увеличивает шанс потери соединения и потенциального возникновения ситуации появления двух ведущих узлов, называемой split brain. Для исключения этой проблемы обязательно требуется использовать сервис кворума, о котором мы поговорим ниже.
Второе условие – выполнение минимальных требований к сети (поддержка IPv6, отсутствие фильтрации трафика) между узлами и ее производительности. Для виртуальных машин, работающих под защитой уровня HA, задержка не должна превышать 10 мс, требуемая пропускная способность – не ниже 155 Мбит/с. Для защиты уровня FT допустимая задержка составляет 2 мс, пропускная способность – не ниже 1 Гбит/с. Как правило, эти требования выполняются сиспользованием оптоволоконных линий на расстояниях от 5 до 10 км. Однако известны случаи, когда система успешно работала и на узлах, установленных на расстоянии больше 50 км друг от друга.
Кроме того, при разнесении узлов дальше, чем на 10 м, рекомендуется приобрести дополнительную лицензию SplitSite, открывающую доступ к расширенной технической поддержке Stratus на всех этапах подготовки и внедрения решения. Лицензия не требует активации, и ее отсутствие не создает искусственных технических препятствий для использования решения самостоятельно, на свой страх и риск.
Сервис кворума
В конфигурации SplitSite используется по крайней мере один, а оптимально – два сервера кворума, обеспечивающие защиту от таких отказов сети, при которых два узла everRun теряют связь друг с другом, но оба продолжают работу. Правильным решением считается размещение серверов кворума на отдельных от основных серверов площадках, как это изображено на рис. 2.
Рисунок 2. Правильное решение – размещение серверов кворума на отдельных от основных серверов площадках
Если в конфигурации отсутствуют серверы кворума, то при потере соединения между узлами возникает ситуация, когда один сервер не может проверить, работает ли второй, что приводит к появлению двух копий виртуальных машин, работающих независимо. В той же ситуации, но при наличии серверов кворума, узел everRun запрашивает у них состояние своей пары и принимает соответствующие меры на основе ответа.
Если сервер кворума не ответит, виртуальные машины, оказавшиеся на изолированном узле, автоматически прекратят свою работу. Виртуальные машины продолжают работать только на том узле, у которого есть доступ к серверу кворума. При наличии двух серверов кворума узлы заранее договариваются об очередности их использования. Если первый сервер кворума перестал отвечать, узлы переключаются на использование второго.
Использование серверов кворума особенно важно в конфигурациях SplitSite. Хорошей практикой считается размещение первого сервера кворума на третьей площадке, а альтернативного сервера кворума – на четвертой. Однако даже размещение обоих серверов кворума в одном месте все еще обеспечивает удовлетворительный сервис, если они максимально изолированы друг от друга и не используют общие источники электропитания или сетевые коммутаторы.
Правильно спланированная и развернутая система everRun Enterprise с использованием технологий SplitSite и сервисов кворума позволяет построить географически распределенную высоконадежную среду виртуализации, способную пережить как полную потерю одной из своих частей, так и потерю соединения между частями без остановки выполнения прикладных задач.
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|