Рубрика:
Администрирование /
Продукты и решения
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
ВИКТОР ОСЬМОВ, технический специалист ЗАО «НПП Родник» («золотой партнер» компании Stratus)
Программное обеспечение Stratus everRun для непрерывной и высокой доступности приложений
В статье рассматриваются несколько методов для обеспечения максимальной продолжительности работы вычислительной системы
При выборе решения конечный пользователь должен найти баланс между стоимостью, сложностью системы и предъявляемыми требованиями к скорости возврата ее к нормальной работе после аварии, уровню доступности системы и RTO (Recovery Time Objective – промежуток времени, в течение которого она может оставаться недоступной в случае аварии).
Надежность и доступность критически важной ИТ-инфраструктуры
Современное предприятие сталкивается с проблемой обеспечения бесперебойной работы компьютерных систем, связанной с высокой стоимостью и сложностью внедрения отказоустойчивых решений. Stratus может предложить способ, гарантирующий высочайший уровень доступности по цене, аналогичной стоимости решений резервного копирования.
Различные уровни доступности:
- Самым высоким уровнем является непрерывная доступность, также известная как отказоустойчивость (FT – fault tolerance). В решениях такого уровня отсутствует единая точка отказа, а любая неисправность, сбой и авария неприводят к остановке работы системы в целом. В отличие от решений высокой доступности или резервного копирования в случае непрерывной доступности отсутствует необходимость перезапуска частей системы, что означает нулевой простой в работе.
- Системами высокой доступности (HA – high availability) называют решения, которые выполняют автоматический перезапуск своих отдельных частей или приложений для восстановления после сбоя. Зачастую такого уровня доступности оказывается достаточно для тех пользователей, для которых остановка в работе их компьютерных систем не принесет особого ущерба.
- Решения аварийного восстановления (DR – Disaster Recovery) предлагают защиту путем асинхронной репликации узлов системы на больших расстояниях между отдельными сайтами через глобальную сеть. Многие организации выдвигают такое требование для достижения целей непрерывности бизнеса на случай стихийных бедствий, таких как наводнения или пожары.
Программное обеспечение Stratus everRun
Затраты, вызванные отказами ИТ-систем, непрерывно повышаются, а потому организации стремятся минимизировать время простоя и его последствия. Сбои в работе вычислительных комплексов, особенно участвующих в контроле безопасности, могут привести к компрометации данных, повреждению имущества или подвергнуть риску сотрудников. Программное обеспечение Stratus everRun обеспечивает как непрерывную, так и высокую доступность. Комплексы, построенные с использованием everRun, продолжают работать без простоев и потери данных.
everRun распространяется в виде двух продуктов: everRun Enterprise и everRun Express, различающихся по стоимости и предоставляемым возможностям:
- everRun Enterprise – обеспечивает как постоянную (FT), так и высокую (HA) доступность одиночной или нескольких защищенных виртуальных машин (PVM - Protected Virtual Machine), работающих под операционными системами Windows или Linux. Использование everRun Enterprise требуется в тех случаях, когда даже кратковременный перерыв в работе компьютерных систем категорически недопустим.
- everRun Express – обеспечивает только высокую (HA) доступность. От других решений этого уровня его отличает простота внедрения и скорость восстановления работы после сбоя. Если правила предприятия допускают кратковременный перерыв в работе компьютерных систем, имеет смысл использовать эту версию.
Как работает everRun
Два сервера связаны через платформу виртуализации, соединяющую защищенные виртуальные машины вместе, и создают единую рабочую среду. Stratus называет эту технологию службой доступности everRun (everRun Availability Services). В случае использования everRun Enterprise, если одна физическая машина выходит из строя, приложение будет продолжать работать на другой физической машине без каких-либо перерывов или потери данных.
В случае everRun Express активным является только один сервер, а другой находится в режиме ожидания. Если активный сервер выходит из строя, приложение перезапускается на резервном с минимальным перерывом. На него же автоматически перенаправляется весь ввод-вывод данных. И в той, и в другой версии, если выходит из строя не весь сервер целиком, а только отдельный аппаратный компонент, everRun подменяет его исправным из второй системы до тех пор, пока сбойный компонент не будет восстановлен или заменен.
Конфигурация SplitSite
В состав everRun входит дополнительный компонент SplitSite, обеспечивающий заданный уровень доступности в случае географического разнесения физических узлов на разные сайты или ЦОДы с использованием синхронной репликации.
Критичным требованием к конфигурации SplitSite является задержка сети, соединяющей узлы, и составляющая максимум 10 мс для высокодоступных виртуальных машин и 2 мс для виртуальных машин постоянной доступности. Прииспользовании сети стандарта 1000BASE-LX, обычная дальность разнесения узлов составляет 10 км.
При использовании конфигурации SplitSite для защиты от потери данных и безопасного включения виртуальных машин в автоматическом режиме в случае обрыва соединения между узлами системы обязательно использование дополнительных вычислительных узлов, предоставляющих сервис кворума. Хорошей практикой является размещение узлов кворума в отдельных от основных узлов системы местах.
Для развертывания конфигурации SplitSite необходима специальная подготовка или профессиональная помощь, поэтому для получения технической поддержки в конфигурации SplitSite требуется приобретение дополнительной лицензии.
ARCServe
Хорошим дополнением к everRun может стать внедрение сервиса аварийного восстановления ARCServe. Этот программный продукт использует асинхронную репликацию данных через глобальную сеть и может работать как сзащищенными виртуальными машинами, выполняющимися в системе everRun, так и с отдельно стоящими серверами на любом сайте. ARCServe предоставляется в трех различных конфигурацях:
- Репликация виртуальных машин (V2V). На двух независимых сайтах развернуты системы everRun, а ARCServe позволит выполнить аварийное восстановление при падении одного из сайтов целиком.
- Репликация виртуальной и физической машин (V2P). В этом случае everRun используется только на основном сайте, а аварийное восстановление происходит на отдельный сервер в запасном месте.
- Репликация физических машины (P2P). Вынужденный случай аварийного восстановления без использования уровней доступности, предоставляемых everRun.
Наиболее распространенным случаем является вторая конфигурация, т.к. позволяет сочетать в себе мощь непрерывной доступности для локальной защиты с технологией асинхронной репликации данных для удовлетворения требований аварийного восстановления за пределами основной площадки. Таким образом, сложная и многоуровневая проблема по обеспечению доступности ответственных приложений решается с помощью единого унифицированного решения.
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|