суббота, 13 ноября 2010 г.

ISSP \ Домен 07. Непрерывность бизнеса и восстановление после аварий. Часть 7

В этой части рассмотрены следующие вопросы:
  • Тестирование и пересмотр плана
  • Реагирование на чрезвычайную ситуацию
  • Поддержка плана
  • Резюме


План ВСР следует регулярно тестировать, поскольку окружение постоянно меняется. Интересно, что многие компании сейчас уходят от концепции полного тестирования, поскольку такое тестирование требует значительных ресурсов и оказывается не очень продуктивным. Вместо этого они используют концепцию проведения упражнений по отдельным частям плана, что требует меньше ресурсов, приводит к меньшим стрессам для персонала, лучше сфокусировано и гораздо более продуктивно. После каждой проверки плана, обычно выявляются возможности для его усовершенствования и повышения эффективности, которые учитываются в обновленной версии плана, обеспечивая постоянное улучшение результатов. Ответственность за проведение периодического тестирования или упражнений по плану, а также поддержку плана в актуальном состоянии следует возложить на определенного человека или группу людей, которые являются владельцами процессов, связанных с обеспечением непрерывности бизнеса всей компании.

Как было отмечено ранее, поддержание актуальности плана должно быть внедрено в процедуры управления изменениями, чтобы все изменения в окружении сразу же отражались в плане.

Тестирование плана, учения и упражнения по восстановлению после аварий должны проводиться не реже одного раза в год. Компания не может доверять разработанному плану, пока он не был проверен на практике. Тестирование и учения готовят персонал к тому, с чем они столкнутся в аварийной ситуации, дают контролируемую среду для обучения сотрудников выполнению возложенных на них задач. Также, тестирование и учения позволяют команде и руководству выявить проблемы, которые были недостаточно продуманы или вообще не учтены в процессе планирования. Проводимые в конце упражнения на практике показывают, действительно ли компания сможет восстановиться после аварии.

Упражнения должны проводиться по заранее подготовленным сценариям, с которыми компания может однажды столкнуться. Будет гораздо лучше, если основные процедуры, предусмотренные в планах, будут отработаны до того, как прозвучит сигнал тревоги. Команда тестирования должна согласовать, что именно будет тестироваться и по каким критериям нужно будет определить, прошло ли тестирование успешно или неудачно. Команда должна согласовать время и продолжительность упражнений, определить тех, кто будет принимать в них участие, кто будет получать задания и какие шаги он должен выполнять. Также, команда должна определить, что будет тестироваться и в какой комбинации: оборудование, программное обеспечение, персонал, процедуры, коммуникационные каналы и т.д. Если, например, в рамках упражнений предполагается перемещение некоторого оборудования на альтернативную площадку, должны быть учтены и проанализированы вопросы транспортировки, установки дополнительного оборудования на основную площадку, подготовки альтернативной площадки.

Большинство компаний не могут допустить, чтобы эти упражнения прерывали работу или снижали производительность компании, это может установить определенные ограничения для упражнений в части их объема или времени поведения, что может потребовать дополнительного логистического планирования. План проведения упражнений следует утвердить официально, в нем должно быть указано, какие слабые места в общем плане восстановления должны быть протестированы. При выполнении упражнений первые несколько раз, не следует привлекать к ним всех сотрудников компании, лучше задействовать в каждом случае различные небольшие группы людей, чтобы они могли изучить свои обязанности. После этого более широкомасштабные учения не окажут негативного воздействия на работу компании. Люди, участвующие в этих учениях, должны быть готовы к тому, что возникнут различные проблемы и ошибки. Собственно из-за этого и проводятся эти учения. Компания сможет узнать, что при выполнении определенных действий или процедур сотрудники часто совершают ошибки, что позволит ей внести необходимые изменения в план, либо дополнительно обучить сотрудников, чтобы они лучше выполняли свои задачи в реальной аварийной ситуации.
ПРИМЕЧАНИЕ. После аварии телефонная связь может оказаться недоступной. Поэтому компании следует предусмотреть альтернативные коммуникационные каналы, например, сотовые телефоны или рации.

Может применяться несколько различных способов проведения учений, каждый из них имеет свои плюсы и минусы. В следующих разделах рассмотрены различные способы проведения учений.

Тестирование содержания плана

При выполнении тестирования содержания плана, подразделениям компании рассылаются копии плана ВСР для изучения и анализа. Руководитель каждого подразделения при рассмотрении плана может выявить, что что-то было упущено, что некоторые подходы следует изменить, а некоторые действия можно удалить без всяких последствий. Этот способ дает уверенность, что ничего не было забыто. Все полученные от подразделений замечания и предложения команда учитывает и вносит изменения в основной план.

Структурированное сквозное тестирование

При выполнении тестирования этим способом, представители каждого подразделения собираются вместе, чтобы пройти по плану и убедиться в его правильности. Группа проводит анализ целей и задач плана, обсуждает его границы и сделанные в плане допущения, анализирует структуру отчетности, оценивает результаты тестирования, подходы к поддержке плана, описание требований к процессу учений. Это позволяет ответственным лицам в компании убедиться, что восстановление работы компании после аварии будет выполнено эффективно и результативно, а также лучше понять, что в аварийной ситуации ожидается лично от них.

Группа от начала до конца проходит по различным сценариям выполнения плана, чтобы убедиться, что ничего не упущено. Также, это позволяет повысить осведомленность членов команд по процедурам восстановления.

Тестирование с помощью моделирования

Этот тип тестирования требует значительно больше планирования и людей. При выполнении такого тестирования, все сотрудники, которые принимают участие в выполнении бизнес-процессов компании и функций поддержки, собираются вместе для практической отработки плана восстановления после аварий на основе заранее определенного сценария. Как и в предыдущих случаях, этот тип тестирования выполняется, чтобы убедиться, что ничего не было пропущено, и никакие угрозы не были забыты. Также, это работает как катализатор для повышения осведомленности вовлеченных в этот процесс людей.

В процессе учений используется только то, что будет доступно в случае реальной аварии (соответствующей выбранному сценарию), для придания учениям большей реалистичности. Моделирование продолжается до момента перемещения персонала и оборудования компании на альтернативную площадку и восстановления работы на ней.

Параллельное тестирование

Паралелльное тестирование выполняется для того, чтобы убедиться, что определенные системы действительно могут работать на альтернативной площадке. Эти системы перемещаются на альтернативную площадку и включаются в работу. Результаты их работы на альтернативной площадке сравниваются с их обычной работой на основной площадке. Это позволяет увидеть, требуются ли какие-либо улучшения, изменения настроек или другие действия.

Тестирование с полным прерыванием

Этот тип тестирования оказывает самое глубокое воздействие на работу компании. Основная площадка реально отключается и работа продолжает выполняться на альтернативной площадке. Команда восстановления реально выполняет свои задачи по подготовке систем и среды на альтернативной площадке. Вся работа выполняется только на оборудовании альтернативной площадки.

Это полноценные учения, которые предусматривают серьезную работу по планированию и координации. Оно позволяет выявить множество недостатков в плане, которые будет необходимо исправить до того, как произойдет реальная авария. Тестирование с полным прерыванием следует проводить только после того, как все другие виды тестирования были успешно выполнены. Такое тестирование является самым рискованным, оно может оказать очень серьезное и разрушительное воздействие на бизнес, если ситуация выйдет из под контроля, поэтому необходимо получить разрешение высшего руководства на проведение такого тестирования.

Выбор наиболее эффективного способа проведения учений зависит от типа компании и ее целей. Каждая компания может использовать различные подходы и иметь уникальные особенности. Для более качественного планирования может потребоваться проведение специализированного обучения участвующих в нем сотрудников. Специализированное обучение в данном случае будет лучше обзорного курса. К тому же высококачественное обучение повысит заинтересованность сотрудников.
В процессе выполнения любого вида тестирования все существенные шаги и события должны быть задокументированы, оформлены в виде отчета и доведены до сведения руководства компании, чтобы оно имело достоверную информацию о результатах тестирования.

Другие типы учений

Сотрудники должны также пройти обучение по другим вопросам, помимо процедур восстановления в случае аварий, например, по вопросам оказания первой помощи пострадавшим, использования огнетушителя, способам управления толпой, процедурам коммуникации в чрезвычайных ситуациях, изучить маршруты эвакуации из здания и способы правильного выключения оборудования при авариях.

Как можно больше технических специалистов должны знать, как восстановить сетевые ресурсы, как переключить работу на резервные телекоммуникационные каналы, если основные выйдут из строя. Дополнительные источники питания должны быть проверены, а процедуры перевода критичных систем от одного источника питания к другому должны быть понятны техническим специалистам и протестированы ими.

Реагирование на чрезвычайную ситуацию

Часто первоначальная реакция на чрезвычайную ситуацию оказывает решающее влияние на конечный результат. Процедуры реакции на чрезвычайные ситуации – это заранее подготовленные планы действий, предназначенные для того, чтобы помочь людям преодолеть последствия аварии. Эти процедуры являются первой линией защиты в отношении кризисных ситуаций.

Если сотрудники постоянно поддерживают свои навыки по восстановлению после аварий, в кризисной ситуации они будут выполнять свою работу гораздо лучше, поэтому очень важно проводить различные учения и практические упражнения. Чрезвычайные происшествия непредсказуемы, никто не знает, когда они произойдут.

Защита жизни людей является наиболее важной задачей, она должна быть выполнена самой первой, а уже после нее можно думать о сохранении материальных ценностей. В процессе учений и упражнений ответственные за это люди должны понять, как безопасно эвакуировать персонал (см. Таблицу 7-3). Весь персонал должен знать о расположении аварийных выходов и пунктах сбора. Пункты сбора в случае аварий должны учитывать сезонные влияния погоды. В каждой группе следует назначить человека, который должен будет проконтролировать, что все люди, за которых он отвечает, покинули здание и благополучно добрались до пункта сбора. Другого человека следует назначить ответственным за уведомление соответствующих уполномоченных органов и служб: полицейского департамента, службы безопасности, пожарной части, скорой помощи и руководства. Прошедшие надлежащее обучение и практические занятия сотрудники, будут гораздо лучше готовы к действиям в чрезвычайной ситуации, а не просто побегут к выходу.

Если возникшая ситуация не представляет угрозы для жизни людей, следует позаботиться о том, чтобы надлежащим образом отключить системы, закрыть файлы с важными данными, а также вынести из здания ценные вещи сотрудников в процессе эвакуации, такие, как сумки, бумажники, одежду. Чтобы организовать это наиболее эффективно, требуется предварительное планирование и упорядочивание этих действий. Как и в других процессах, здесь существует зависимость последующих действий от сделанных ранее. Поспешное решение о пропуске отдельных шагов в действительности может нанести больше вреда, чем принести пользы.

Если в компании возникнет серьезная авария, вероятно потребуется один или несколько сотрудников для взаимодействия с внешними лицами и организациями, такими как пресса, клиенты, акционеры или представители общественности. Желательно, чтобы эти сотрудники имели заранее подготовленные заявления и ответы, которые в достаточном объеме, разумно и непротиворечиво объясняют сложившуюся ситуацию, предпринимаемые компанией действия, пояснения о том, что могут ожидать от компании ее клиенты, контрагенты и партнеры. Компании следует быстро сообщить эту информацию, чтобы не позволять другим делать собственные умозаключения и порождать фальшивые слухи. Как минимум один человек должен быть постоянно доступен для прессы, чтобы гарантировать, что правильная информация и ответы на вопросы будут своевременно предоставлены.

Также, заранее следует учесть другие возможные неблагоприятные последствия чрезвычайной ситуации, такие как вероятное мародерство, вандализм, появление удобных возможностей для мошенничества и т.п. После того, как компания столкнется с масштабной аварией или чрезвычайной ситуацией, она становится очень уязвима, и некоторые могут попытаться воспользоваться этим. Поэтому следует продумать это заранее и запланировать соответствующие шаги, обеспечивающие приемлемый уровень защиты компании.

Таблица 7-3. Пример процедуры реакции на чрезвычайную ситуацию


К сожалению, рассмотренные в этом Домене планы могут быстро потерять свою актуальность. Неактуальный план ВСР может дать компании ложное чувство безопасности, и приведет к массе сюрпризов, когда произойдет реальная авария.

Среди причин, по которым планы теряют свою актуальность, можно отметить следующие:
  • Процесс обеспечения непрерывности бизнеса не интегрирован в процесс управления изменениями
  • Произошли изменения инфраструктуры и окружения
  • Реорганизация компании, увольнения, поглощения
  • Изменения в аппаратном и программном обеспечении, приложениях
  • После создания плана сотрудники решили, что на этом работа по обеспечению непрерывности бизнеса компании закончена
  • Текучесть персонала
  • Планам требуется большой объем работы для поддержки их актуальности
  • Планы не имеют прямой связи с прибылью компании
Компания может сохранить актуальность плана, выполняя следующие действия:
  • Сделать обеспечение непрерывности бизнеса частью любого бизнес-решения
  • Включить обязанности по поддержке плана в должностные инструкции
  • Включить результаты поддержки плана в оценку работы персонала
  • Выполнять внутренние аудиты, включающие проверку восстановления после аварий, документации по обеспечению непрерывности и соответствующих процедур
  • Выполнять регулярные практические учения по выполнению плана
  • Интегрировать вопросы непрерывности бизнеса в процесс управления изменениями компании
Одним из простейших и наиболее экономически эффективных и результативных способов сохранения актуальности плана, является его внедрение в процесс управления изменениями компании. Вы должны вспоминать о нем при вводе в эксплуатацию новых приложений, оборудования, сервисов, когда вы устанавливаете обновления и в других подобных случаях. Следует обновить процесс управления изменениями компании, чтобы в нем были учтены функции по уведомлению команды ВСР о планируемых изменениях, предусматривалось выделение ресурсов для обновления документации по восстановлению. Какой смысл ежегодно вытирать пыль с плана, если он разработан для систем, которые использовались в компании три года назад?

Ссылки по теме:

Жизненные циклы. Помните, что у планов DRP и BCP есть свои жизненные циклы. Если компании нужны действительно работоспособные планы, она должна понимать это и поддерживать планы на каждом этапе их жизненного цикла.


Хотя в настоящее время большинство компаний присваивает низкий приоритет задачам по планированию непрерывности бизнеса, это не означает, что эти задачи не важны. К сожалению, чтобы понять важность планирования непрерывности, во многих случаях компания должна пройти через серьезную аварию или чрезвычайную ситуацию. Тогда она поймет, насколько важно заранее предпринять шаги, чтобы избежать подобных случаев в будущем или снизить их последствия.

Чтобы разработка планов обеспечения непрерывности бизнеса оказалась успешной, она должна пройти через определенные этапы. Должны быть выявлены и поняты реальные угрозы, перед лицом которых стоит компания, должны быть продуманы и внедрены контрмеры для них, а если неприятность все же произойдет, должны быть разработаны соответствующие планы действий.

Комментариев нет: