19 ноября, понедельник 14:01
Bankir.Ru

Объявление

Свернуть
Пока нет объявлений.

Нормативы на время восстановления работы сервера.

Свернуть
X
  • Фильтр
  • Время
  • Показать
Очистить всё
новые сообщения

  • Нормативы на время восстановления работы сервера.

    Коллеги!
    Представьте ситуацию - вышел из строя сервер с АБС.
    Естественно, начинается процедура восстановления работоспособности.
    Как по - вашему, через сколько времени Банк должен начать работать в привычном для себя режиме?
    Прописан ли в "аварийном плане" норматив на время восстановления работы сервера?
    Последний раз редактировалось SNAK; 07.05.2002, 13:47.

  • #2
    SNAK Отвечаю только на вопрос Как по - вашему, ... ?
    Так вот, по мОему: Если нет "автопереконфигурации" системы на резервный сервер, тогда - банк должен заработать не позднее, чем через 30 минут при ручной процедура восстановления работоспособности. Иначе будут проблемы с клиентами. Если более 2-х часов, тогда - могут быть проблемы с ЦБ.
    Если же такая "автопереконфигурация" есть, тогда - быстрее. Минут за 3-5. Не на всяком железе можно сделать "автопереконфигурацию". И не каждая АБС позволит восстановиться с более-менее поздней копии... Горячее резервирование на работающей АБС на резервный сервер, увы, есть не везде...
    Да пребудет с Тобою Великая Сила! ©

    Комментарий


    • #3
      К_Маркелов

      Все зависит от степени выхода из строя сервера, вам не кажется? Т.е. попробовать реанимировать, установить резервный сервер на новую машину, переконфигурить, закачать сохраненную копию: где-то 1-3 часа, в случае, если нет резервного сконфигурированного сервера.

      Комментарий


      • #4
        2 godata

        Последовательность действий должна быть другой
        Сначала ставим резервный сервер (лучше чтобы он уже был), заливаем туда актуальную базу (опять-таки желательно чтобы последний архив там уже был), кидаем юзеров на него
        Ну минут 3-5 на это может и не хватит , но если предусмотреть все заранее, то 30-60 мин не такой уж нереальный срок Все зависит от организации дела и конкретной АБС Это и прописывается в аварийном плане

        Потом спокойно разбираемся с рухнувшим

        Комментарий


        • #5
          Уважаемый godata!! Я согласен с vsv!!! Резервный сервер (а не "новая машина") должен быть всегда. Желательно - в другой комнате (по крайней мере). А времена и нормативы ... Все зависит от организации дела и конкретной АБС, и ещё от используемого железа...
          Да пребудет с Тобою Великая Сила! ©

          Комментарий


          • #6
            2 К_Маркелов и vsv
            Вопрос: а если только на заливку актуальной базы (ну очень большая база) на резервный сервер требуется 1-2 часа, даже по гигабиту? Рассуждения уважаемого vsv применимы только для резервного сервера, работающего в "зеркальном режиме" с основным. Наличие "зеркального сервера" повышает отказоустойчивость системы на порядок, но не каждая организация сейчас может это себе позволить.
            Наиболее приемлимым решением является кластерная конфигурация серверов. Преимущество заключается в том, что все серверы в кластере поддерживают свои задачи, а при сбое берут на себя нагрузку вышедшего из строя сервера.

            Комментарий


            • #7
              Koloboff - мало того, не всякая АБС этот режим (кластерный) поддерживает - это ведь ещё завязано и на ОС... В основном, конечно, организация резервного копирования в Банках (по опыту общения с сотрудниками IT - подразделений) строится на вечернем (ночном - в зависимости от размера базы) резервном копировании данных за пршедший день. Естественно, имеется резервный сервер, подготовленный для приёма базы. Минус такой технологии - потеря данных введённых после создания резервной копии. Естественно, после сбоя закачиваются данные, полученные по системе клиент-банк (журналы транзакций, как правило, дублируются на резервных дисках).

              на заливку актуальной базы (ну очень большая база) на резервный сервер требуется 1-2 часа - можно использовать хот-своп диски, переткнул - и готово Конечно, это вариант не для "оплавившегося" сервера, а для "нормально рухнувшего" - тогда, чаще всего, "зеркальные" диски остаются целы

              vsv кидаем юзеров на него - тут тоже не всё однозначно... Как вариант, на дектоп пользователя сразу ставится две иконки - для запуска основной АБС и резервной, причём запуск второй(резервной) блокирован средствами ОС. Из минусов - некоторые АБС (в частности наша, Диасофт) требуют для запуска исполнение процедуры "привязки" к оборудованию, что также не повышает оперативность восстановления работоспособности...

              Это и прописывается в аварийном плане - как раз этим мы и решили заняться

              К_Маркелов Если более 2-х часов, тогда - могут быть проблемы с ЦБ - это отражено в каких-нибудь ЦБ-шных документах? Сдаётся мне, в таком случае, ЦБ давно пора заинтересоваться БОЛЬШЕЙ частью мелких и средних Банков

              Комментарий


              • #8
                2 Koloboff

                А никто не спорит что это все индивидуально
                Сказано же А времена и нормативы ... Все зависит от организации дела и конкретной АБС, и ещё от используемого железа... В том числе и что лить, как лить, куда лить и когда И сколько времени это занимает

                Кластеры тоже не в каждом банке, хотя это конечно да, тут Вы правы

                А вообще-то купить сервер по деньгам может себе позволить любой банк Делает он это или нет другой вопрос С кем поведешься так тебе и надо

                Суть дела в том что изначально обеспечивается работа банка на резерве, а затем развлекаешься с рухнувшим серваком Ибо какими бы неприятными личностями не были клиенты и бухи, но делается то это все для них, а не для того, чтобы нам было весело и много денег

                Если позволяют объемы etc, скажем, то есть дешевое решение следующего плана:
                1. В любом уважающем себя банке есть как минимум 2 сервака
                2. Один из них под АБС
                3. Второй под что нибудь другое, но на нем лежит болванка АБС, которую можно быстро поднять
                4. Ночью например туда льется архив (Ясно что есть банки работающие круглосуточно, но архив то ежедневный делать надо Можно лить туда потом с архива Это уже детали)
                Вот и получаем в принципе сервак с актуальной базой "на вчера" и без зеркалирования

                Комментарий


                • #9
                  2 SNAK

                  требуют для запуска исполнение процедуры "привязки" к оборудованию, что также не повышает оперативность восстановления работоспособности

                  Ну вы такие неудачники
                  Нам с R-Стулом попроще Можно даже изначально не ставить второй терминал, рисуешь людям в профиль NT закачку и шлешь message на предмет а не хотите ли вы все перезайти в сеть

                  это отражено в каких-нибудь ЦБ-шных документах?
                  Насколько мне известно (уважаемый г-н Маркелов поправит если я не прав) в явном виде нет Есть регламенты по сдаче отчетности, по отправке тех же рейсов и т. д. Отсюда и можно плясать
                  А заинтересоваться... Зайдите в форум по Персоналу, подфорум про Банки Там есть тема про ЦБ Можно их поругать

                  Это и прописывается в аварийном плане - как раз этим мы и решили заняться

                  У нас в аварийном плане, точнее концепции безопасности, жестко время на восставноление не прописано Сделана (если я правильно помню) ссылка на то, что все зависит от степени повреждения и т. д. Реально мне чтобы на нынешних объемах и при нынешней системе резервного копирования поднять сервак на вчерашнюю базу требуется минут 20, если лить актуальную - около 40 - 45 мин

                  А я правильно понял, что Вам для того чтобы сделать ту самую привязку ДиаСофта к оборудованию нужно ножками по всем пробежаться? Или не все так печально?

                  Комментарий


                  • #10
                    vsv если лить актуальную - около 40 - 45 мин - а откуда данные актуальные будете брать? Про вчерашнюю не спрашиваю - тут всё понятно
                    нужно ножками по всем пробежаться? - нет, надо послать факс в Диасофт с просьбой выслать обратно код привязки (типа, как при активации Windows XP). Привязка выполняется с рабочей станции администратора.
                    рисуешь людям в профиль NT закачку - это как?!?! Через группопвые политики что ли?
                    А на сервере - то у Вас NT стоит, или NetWare?

                    Комментарий


                    • #11
                      2 SNAK

                      На серваке NT Лучше он под ней работает Сейчас это даже R-Style признал, насколько мне известно

                      рисуешь людям в профиль NT закачку - это как?!?!
                      Можно в принципе и через групповые политики, но у нас по другому
                      Там есть такая штука , Logon Script Name Он у нас один, для простоты жизни На нем сверху сидит сервис мною лично написанный , который уже ловит юзера, смотрит его принадлежность группам и коннектит все что надо
                      Ну и пишешь в этот батчик все что угодно

                      а откуда данные актуальные будете брать
                      Ну это если сервак нормально рухнувший

                      Комментарий


                      • #12
                        Если интересуют нормативы по восстановлению сервера, то их как таковых нет.
                        Каждый для себя в аварийном плане прописывает свои сроки. В аварийном плане перед 2000 г. у нас были прописаны технологии работы по ручному приему плат. док на случай аварии на электростанции. Резервное освещение - аккумуляторные фонари и ... свечи
                        По личному опыту, если удаеться поднять сервер или развалившуюся базу за 30-45 мин., то это персонал банка не озлобляет и никаких карательных санкций не следует. Простой 1-2 часа - приходится писать объяснительные. От 3 часов и более - объяснительные, служ. расследование и лишение премии.
                        Вот и все нормативы.

                        Комментарий


                        • #13
                          Koloboff - так для этого и составляется аварийный план. Дело в том, что автоматизация, как правило, готова обеспечить любое приемлимое время восстановления нормальной работоспособности Банка. Просто это время надо заложить в норматив восстановления и выделить под него ресурсы - технику, людей.
                          Действительно, можно заложиться на самые жесткие нормативы и тупо поставить кластер - но насколько это реально нужно Банку, действительно ли это жизненно необходимые затраты? Поэтому я и предпринял попытку опроса - как мелкие и средние Банки (а их подавляющее большинство) видят проблему сроков восстановления после сбоя, какое по меркам третьего тысячелетия допустимое время простоя...

                          В аварийном плане перед 2000 г. - кстати, он с тех пор обновлялся? У нас предусмотрено его обновление при любом изменении аппаратных средств и ПО - что очень понравилось проверке ГУ ЦБ
                          vsv - Понятно. А HASP просто перетыкаете - и всё? UNC имена и пути приходится менять?

                          Комментарий


                          • #14
                            2 Koloboff

                            на случай аварии на электростанции
                            А ты им дизель предложи купить Если я не ошибаюсь стоит вся любовь что-то около $150 000 Кстати когда я работал в Магаданском Сбере, там поставили дизель, пару раз свет вырубали, врубаешь его и все классно

                            2 SNAK
                            Да у нас вообще-то и не падало ничего ни разу толком Но HASP переткнуть - дело 5 минут
                            Насчет имен и путей - за 6 лет работы у нас выработалась концепция системы, позволяющая обходится без UNC (за очень редким исключением) и жестких путей
                            Все пути относительные, и перенос с сервака на сервак происходит без проблем
                            Просто не надо верить всему, что рекомендует R-Style

                            Комментарий


                            • #15
                              vsv - Эт как это без UNC? Ну, %System Root% - это я понимаю А сетевые пути как же прописываете?
                              А ты им дизель предложи купить - и мобилу с нехилыми аккумуляторами и стыковкой с компьютером туда же : а вдруг порвут телефонный кабель...

                              Комментарий


                              • #16
                                2 SNAK
                                А зачем в RSBank %System Root%

                                Сетевые пути используются только макросах чтобы стунуться на какой-нибудь сторонний сервак, и то их можно вынести в отдельные настройки

                                Суть дела в том, что мы взяли (эту идею я опробовал еще в Магадаском Сбере более 2-х лет назад, а там объемы не хилые) мощный сервак с достаточно быстрым RAID'ом и базы валяются на одном серваке с сервером приложений
                                Понятно что конкретная конфигурация зависит от объемов, но не так уж это все и дорого на самом деле
                                Если надо разнести, то можно скажем мапить диски На самом деле по сравнению с UNC если задержка и есть, то она не заметная ни разу Кстати еще в бытность сервером баз данных Новелевского сервака мапирование через GateWay даже давало оперделенный выигрыш по скорости

                                Комментарий


                                • #17
                                  2 SNAK
                                  Степа, я чего-то не понял проблемы. Иметь тестовый сервак -- дело обязательное. Иметь на нем актуальный для тестовой базы bankdb и ctl -- тоже как бы надо -- значит код ответа уже записан -- так какие проблемы? Все остальное -- время на подъем бакупа базы -- зависить от объема базы и типа бакупа. Вычисляется с точностью до минуты при очередной изготовке тестовой версии. Определить группу DiaTest и дать ей права гна тестовый сервер/базу -- несложно. Вогнать в нее группу Diabank после смерти основного сервера -- 30 секунд.
                                  Serg Voronov

                                  Комментарий


                                  • #18
                                    Serg_FSB - ну, поднимешь ты сервак со вчерашней базой. Пользы от этого в 17:45 - 0,5% Надо же "честно" вычислять время начала нормальной работы Банка после сбоя! Хотя для времени падения сервера 9:00 - твой алгоритм оптимален

                                    Комментарий


                                    • #19
                                      2 SNAK
                                      Звиняй батьку... Бтрив такого не умеет... Добро пожаловать на WF Pro и хоть оббакапируйся каждые 10 минут...
                                      Serg Voronov

                                      Комментарий


                                      • #20
                                        Serg_FSB - хоть оббакапируйся каждые 10 минут... - тоже один из аргументов для перехода, и немаловажный!

                                        Комментарий


                                        • #21
                                          Serg_FSB
                                          Звиняй батьку... Бтрив такого не умеет...
                                          Вообще-то умеет. Есть такая штука, как журнал транзакций. Приостанавливаешь транзакции, копируешь базу, накатываешь транзакции на базу. Если интересно - почитай про BUTIL -STARTBU/ENDBU
                                          Добро пожаловать на WF Pro и хоть оббакапируйся каждые 10 минут...
                                          А это что за зверь ?

                                          Комментарий


                                          • #22
                                            Еще бы научить Диасофт 4х4 ДОС в таком режиме не дохнуть... Мучают меня смутные сомнения что это прокатит.
                                            А ВФ Про -- это DiasoftBank 4x4 Workflow Professional. В качестве СУБД MSSQL. Официальные сказки на www.diasoft.ru
                                            Serg Voronov

                                            Комментарий


                                            • #23
                                              Еще бы научить Диасофт 4х4 ДОС в таком режиме не дохнуть
                                              Мне кажется, Диасофт тут не при чём. Он ни о чём и не узнает. Это же фишка чисто на уровне базы.
                                              Только надо знать точный перечень файлов, на которые этого зверя напускать... Если не знаешь - напускай на все

                                              Комментарий


                                              • #24
                                                Как обычно скатились к конкретным техническим решениям в двух конкретных АБС.

                                                Попробуем вернуться к теме: Как по - вашему, через сколько времени Банк должен начать работать в привычном для себя режиме?
                                                Прописан ли в "аварийном плане" норматив на время восстановления работы сервера?


                                                Начну с начала.
                                                1. Аварийный план пишется для Банка в целом. Рассматриваются самые разные ситуации, начиная от "упавшего сервера" и заканчивая глобальными природными катаклизмами.
                                                2. Если говорить об ИТ, то аварии делятся по степени критичности. По каждой аварии указывается время восстановления функциональности (неважно, резервный сервре поднят или старый починили - главное, чтоб работало)
                                                3. Подразделения в ответ на сроки предложенные ИТ готовит свои мероприятия (как обслуживать клиентов, какие операции сможно отложить и т.п.)

                                                Отвечаю не поставленные вопросы:
                                                1. "через сколько времени" - решать руководству банка.
                                                2. "время восстановления работы" - должно быть указано. Даже если приджется указать "Работа восстановлена не будет" - это необходимо для планирования бизнеса.

                                                Сам эти планы писал 2 года назад. Получилось сыровато, но пару раз уже помогло. Реально подобные документы надо корерктировать не только при изменнии конфигурации, но и по мере накопления опыта.

                                                Еще раз хочу подчеркнуть, что решение должно быть для Банка в целом, а не для ИТ. У нас, например, предусмотрен вариант перезда некоторых подразделений на временную площадку (у нас несколько независимых территорий)

                                                Комментарий


                                                • #25
                                                  A.Bur -Действительно, первоначально вопрос был поставлен шире. Правда, конкретные тех.решения для пары популярных АБС тоже интересны многим.


                                                  Прм написании аварийного плана я исходил из того, что "Аварийные или сбойные ситуации классифицируются не по источнику их возникновения, а по характеру и последствиям их влияния на нормальное функционирование Банка. Например, потеря определенных данных в результате выхода из строя накопителя на жестких магнитных дисках и физическое удаление этих данных в результате ошибки или преступного умысла сотрудника банка, имеют одинаковые последствия и требуют проведения одного и того же комплекса мероприятий." Это помогло сократить число возможных ситуаций до разумного. Хотя "план" и сейчас сыроват - вот и пытаюсь довести его до ума...


                                                  "через сколько времени" - решать руководству банка - верно. В конечном итоге, всё завершится расчётом "норматива" эффективность/стоимость и реализацией подразделением IT необходимого уровня стабильности.
                                                  Но мне кажется, не грех поинтересоваться и опытом аналогичных Банков - типа, "отраслевым стандартом" на сегодняшний день

                                                  Комментарий


                                                  • #26
                                                    конкретные тех.решения для пары популярных АБС
                                                    Замечу, что (пока и ещё лет 5 как минимум imho) далеко не для пары. Взять тот же Кворум, ЦФТ-шные софтины и т.п. Все на btrieve. Что не есть плохо (опять же imho).

                                                    Комментарий


                                                    • #27
                                                      A.Bur
                                                      1. Аварийный план пишется для Банка в целом. Рассматриваются самые разные ситуации, начиная от "упавшего сервера" и заканчивая глобальными природными катаклизмами.
                                                      2. Если говорить об ИТ, то аварии делятся по степени критичности. По каждой аварии указывается время восстановления функциональности (неважно, резервный сервре поднят или старый починили - главное, чтоб работало)
                                                      3. Подразделения в ответ на сроки предложенные ИТ готовит свои мероприятия (как обслуживать клиентов, какие операции сможно отложить и т.п.)


                                                      Я делал несколько иначе. В смысле, подходил с другой стороны.
                                                      1. Подготовил список угроз. Начиная от временного выхода из строя одного сервера и заканчивая взрывом атомной бомбы в центре города.
                                                      2. Разделил всю банковскую автоматизацию на ряд подсистем, по каждой определил для себя ответственного от бизнеса, так сказать, заказчика.
                                                      3. Запустил в заказчиков опросник, в котором попросил указать, от какой угрозы их подсистема должна быть защищена и каково допустимое время простоя в случае аварии.
                                                      4. Практически не глядя в ответы (разумеется, все ответили, что защищаться надо от ядерной бомбы, а время простоя - не больше 5 минут), организовал совещание, объяснил зависимость стоимости решения от указанных параметров. Предложил заказчикам самостоятельно обосновать запрошенное время простоя перед советом директоров. Попросил ответить на те же вопросы еще раз.

                                                      Результат превзошел даже мои ожидания - прикрываемся от аварии единицы техники, допустимый простой:
                                                      Связь с ЦБ - 30 минут
                                                      Пластики - 2 часа
                                                      Остальные - от 4 часов до суток простоя.

                                                      А уже дальше - почти по Вашему плану, только чрезмерно серьезные аварии в плане не рассматриваются.

                                                      Комментарий


                                                      • #28
                                                        Mic - а отделения и филиалы у Вас есть? Им, да ещё операционистам (всё ж работа с живыми клиентами) - 4 часа многовато...

                                                        Комментарий


                                                        • #29
                                                          Интересно, а кто-нибудь из разработчиков АБС даёт рекомендации по обеспечению отказоустойчивости своих систем (ну, кроме "зеркалирования дисков", конечно...)?

                                                          Комментарий


                                                          • #30
                                                            SNAK а кто-нибудь из разработчиков АБС даёт рекомендации по обеспечению отказоустойчивости своих систем . Даёт!!! Список наизусть не помню ... Первым или вторым пунктом рекомендаций - наличие грамотного администратора СУБД.
                                                            Да пребудет с Тобою Великая Сила! ©

                                                            Комментарий

                                                            Пользователи, просматривающие эту тему

                                                            Свернуть

                                                            Присутствует 1. Участников: 0, гостей: 1.

                                                            Обработка...
                                                            X