Проблемы высокой доступности баз данных

Проблемы высокой доступности баз данных

Большинством причин которые приводят к недоступности систем являются человеческие ошибки. Способность быстрого восстановления после таких ошибок занимает ключевое место в доступности баз данных. Исследование, проведенное Девидом Паттерсоном в его труде, «Простой способ оценить недоступность системы», показал что 53% внепланового простоя приходится на человеческие ошибки. Другое исследование опубликованное в “Disaster Recovery Journal” показало что человеческие ошибки приводят к 36% потери данных, происходящих в компаниях. Очевидно что, преодоление человеческого фактора является одним из самых больших шагов на пути к высокой доступности. Ведь, если задуматься, минутная ошибка оператора может привести к ошибкам в базе данных на исправление которых потребуются часы или дни. Эти часы восстановления могут быть весьма дорогостоящими, но самое главное – их можно избежать!

Люди совершали и будут совершают ошибки, однако необходимо проработать шаги, которые помогут снизить время простоя и время восстановления после этих ошибок. Человеческие ошибки имеют два основных источника: пользовательские ошибки и ошибки оператора. Если возможно, пользователи могут нанести ущерб информации в компании неосторожно удаляя важные данные или некорректно обновляя базу данных неправильной информацией. Обучение, создание необходимой документации и учреждение регулярных процедур — это лучшее что можно сделать для защиты информации от пользовательских ошибок. Один из наиболее важных шагов для защиты от пользовательских ошибок это ограничение доступа пользователя к данным и сервисам, то есть разрешение работать только с той информацией которая ему необходима для работы.

Ошибки оператора или разработчика приложений также могут оказывать юбольшое влияние на доступность базы данных или приложения. Например, некорректное удаление таблицы из базы данных или ошибочный код приложения, который приводит к записи некорректных данных в базу данных - все это может оказать значительное влияние на доступность приложения. Хорошим способом предотвращения подобных типов ошибок является увеличение осведомленности персонала, и особенно высшего менеджмента о сложности и ответственности которые связаны с постоянной доступностью информации. Это приводит к увеличению тренировочных курсов и трате времени и ресурсов на разработку руководств по эксплуатации и создание планов восстановления после сбоя.

Перед администратором баз данных стоит все более трудная задача поддержки целостности баз данных. Во многих случаях, администратору нужно принимать участие во всех фазах процесса разработки. Это может включать разработку архитектуры базы данных, разработку приложения, управления базами данных и реализация сценариев для восстановления базы данных после сбоя. Администратору баз данных нужно быть хорошо обученным для оперативного разрешения проблем и нужно иметь необходимые инструменты для эффективной реализации плана восстановления на практике.

Процессы и доступность баз данных

Другая область которая может имеет глубокое влияние на создание высоко доступной вреды – это внутренние процессы. Учреждение соответствующих процессов может помочь снизить время простоя и создать более быстрые процедуры восстановления в случае отказа сервисов.

Одно из наиболее важных препятствий на пути к высокой доступности это недостаточное количество документации, описывающие документально рабочие процессы. Организации нужно разработать процедуры описания рабочих процессов в письменном виде для того чтобы выполнение работ производилась по заведенному распорядку, также нужны соответствующие документы, описывающие процесс восстановления после различных типов сбоев. Эти документально описанные процедуры обычно называются оперативным руководством или оперативной документацией (run books). Недостаток адекватной документации может привести к неточному восстановлению или пропуск некоторых шагов при восстановлении после сбоя и, поэтому, потенциально может значительно увеличить время полного восстановления системы. Аналогично, нехватка актуальной документации для рабочих оперативных процедур увеличивает вероятность возникновения ошибок операторов, особенно в ситуациях когда происходит смена персонала либо в результате болезни, либо при смене позиции внутри компании и переназначении сфер ответственности. Поиск неисправностей также может быть затруднен из-за недостатка документального описания процесса. Без стандартного описания процедур разные сотрудники могут выполнять одни и теже задачи немного по-разному, мешая правильно установить последовательность шагов, которые привели к данной ситуации. Эффективное оперативное руководство позволит начинающему администратору баз данных эффективно проводить рабочие операции также хорошо как и более опытные члены команды.

Неадекватная документация по разрешению проблем – другая область где нехватка надлежащего процесса может негативно сказаться на доступности. Создание специальных процедур для разрешения проблем может помочь рабочему персоналу идентифицировать общие сценарии возникновения проблем и дать им возможность более быстро выявлять и разрешать проблемы в разных ситуациях. Недостаток стандартных процедур управления инциндетами приводит к необходимости организации хелпдеска и персонал вынужден изобретать колесо снова когда данная ситуация повторяется. Это увеличивает время восстановления из уже известной в прошлом ситуации и также увеличивает возможность некорректного диагностирования проблемы. И снова, конечным результатом может быть увеличение времени простоя или даже возникновение других проблем.

Неадекватные процедуры управления изменениями могут также служить серьезным препятствием на пути к высокой доступности. Процедуры управления изменениями позволяют организации отслеживать изменения приложений и схемы базы данных которые возникают в течение жизни приложения. Вдобавок, для обеспечения стандартного механизма для отслеживания исходного кода и изменений в схеме базы данных, создание процедур управления изменениями влечет за собой создание среды проверки качества где изменения сначала проверяются на тестовых стендах и только после этого происходит из развертывание в производственной среде. Отсутствие таких процедур может привести к большим ошибкам восстановления где обновления схемы баз данных и обновления приложения могут быть потеряны или же перезаписаны последующими изменениями, которые оказались не в состоянии включить последние обновления. Поэтому недостаток или отсутствие тестовой среды может привести к тому, что развертывание новой версии приложения или изменения схемы базы данных может привести к ошибками и как следствие к недоступности производственной системы.

Есть еще два препятствия на пути к высокой доступности — это недостаток стандартных аппаратных и программных конфигураций. Поэтому в центре обработки данных нужно использовать именно стандартные конфигурации оборудования и программного обеспечения. Стандартные аппаратные компоненты позволяют легче производить восстановление системы или же проводить замену этих компонент в случае выхода их из стоя. Аналогично, стандартизованные программные конфигурации существенно облегчат проведение стандартных операций и уменьшат вероятность ошибки оператора.

Например, если возможно, все сервера должны использовать стандартную схему именования и иметь стандартные буквы дисков, связные папки и имена папок совместного доступа. Плюс к этому все сервера баз данных должны работать под одним и тем же сервисным пакетом на уровне операционной системы, СУБД и среднего слое доступа к данным.

Недостаток стандартных аппаратных и программных конфигураций увеличивает количество мест появления ошибки приводя к увеличению времени на поиск и устранение неисправностей.

Последним барьером может стать создание высоко доступной среды на исходя из неправильных или устаревших знаний. Прохождение курсов повышения квалификации на регулярной основе для всего персонала, работающего с информацией поможет быть уверенным в том, что персонал обладает всеми необходимыми современными знаниями. Помимо этого такие курсы смогут существенно помочь в определении необходимых технологий и инструментов для.

Технологии доступности баз данных

В технологической области для достижения самых высоких уровней доступности также придется решать несколько проблем. Сбой на аппаратном уровне может произойти из-за почти любого компонента сервера. Ошибки приложений могут повлиять на доступ к базе данных. Должны быть соответствующие механизмы восстановления баз данных для восстановления в случае повреждения данных. Плановые обновления аппаратного обеспечения и обслуживание базы данных это также факторы которые могут уменьшить доступность системы. Преимущества технологий высокой доступности на уровне базы данных могут уменьшить или вообще исключить простой при плановом обслуживании. И последнее, сбои на инфраструктурном уровне или на уровне сайта могут оказать глубокое влияние на доступность базы данных.


Карта сайта


Информационный сайт Webavtocat.ru