АЛЕКСЕЙ БЕРЕЖНОЙ, независимый консультант, системный архитектор, специалист по системам виртуализации и резервного копирования, alexey.berezhnoy@tech-center.com
Проектирование отказоустойчивых систем
Часть 1. Термины и определения
Статья посвящена терминологии построения отказоустойчивых ИТ-систем. Помимо описания самих терминов, рассказывается о принципах создания надежной инфраструктуры
Нет смысла говорить о том, как важны информационные технологии. По сути, это и есть наша с вами жизнь, точнее, ее оцифрованное представление. И бизнес, и общественная деятельность, и даже личная жизнь зависят оттого, насколько надежной является ИТ-инфраструктура, которой мы вверяем свое существование.
Но для того, чтобы создать надежную ИТ-инфраструктуру, не получится просто «начать что-то делать». Нужно определиться с конечными целями, задачами, которые предстоит решить для их достижения, методами ихрешения. Понадобится, по сути, создать своего рода язык, позволяющий описать необходимые объекты и взаимодействие между ними. Данная статья посвящена вопросам терминологии.
Факторы риска
Прежде чем проектировать защищенную информационную систему, неплохо для начала определить, от чего собираемся защищаться.
Неприятности, преследующие ИТ-инфраструктуры, условно могут быть разделены на несколько категорий.1. Природные: наводнения, ураганы, торнадо, извержения вулканов, землетрясения и так далее. Словом, все грозные явления природы, которые человечество пока не в состоянии предотвратить.2. Техногенные: такие как производственные аварии и другие проблемы, выводящие из строя ИТ-инфраструктуру. Сюда же можно отнести серьезные сбои оборудования, повлекшие за собой остановку бизнес-процессов. Например, пожар или прорвавшаяся батарея в серверной. Или случайные короткие замыкания, выводящие из строя оборудование.3. Антропогенные: теоретически их также можно отнести к техногенным факторам, если бы не одно серьезное отличие – непосредственное участие человека. В этот же список входят и угрозы безопасности: заражения вирусами, всевозможные внутренние и внешние атаки и взломы, серьезные ошибки в области ИТ, а также неудачные реализации изменений, например, установка обновлений. Также стоит упомянуть о риске использования нелегального программного обеспечения и его последствиях: изъятии компьютерной техники, судебных разбирательствах и так далее.Для предотвращения аварий второго и третьего типа особую роль играют наблюдение за системой, тестирование компонентов и тщательное планирование своих действий.Но, в любом случае, для снижения рисков необходимы превентивные меры, о которых пойдет речь ниже.
Статью целиком читайте в журнале «Системный администратор», №4 за 2015 г. на страницах 10-15.
PDF-версию данного номера можно приобрести в нашем магазине.