Жизнь после миграции: а как же сопровождение, управление и мониторинг?

Опыт проектов в части внедрения коммуникационных решений на базе CommuniGate Pro, а также создание ИТ-инфраструктур на базе Linux, позволяет нам предложить ряд идей, которые окажутся полезными для архитекторов и администраторов, вступающих на этот путь. Вячеслав Пронин, системный архитектор “Диджитал Дизайн”, рассказал о некоторых особенностях управления и сопровождения крупных решений на базе CommuniGate Pro.

 

Когда же стоит присмотреться к менее знакомым технологиям и подходам? Конечно, все зависит от планируемых масштабов внедрения: если речь идет об одном сервере, одном кластере и одной площадке – все достаточно просто, и привычные подходы все еще работают. Простой мониторинг, ручное администрирование, резервное копирование все еще эффективны. Ну и системный администратор пригодится.

Но если наши планы более дерзкие? Десятки площадок, сотни серверов, тысячи – десятки тысяч пользователей? У действительно ответственных специалистов голова может начать болеть, а сон стать более прерывистым. Хотя причины такого беспокойства давно уже известны, классифицированы, и включают в себя:

  • Трудности управления конфигурацией: тот самый процесс управления конфигурацией оказывается не просто желанием развести больше бюрократии и согласования комитетом, а здоровым стремлением знать: какие конфигурационные параметры действительно используются, какие изменения внесены, и каким образом можно все откатить или развернуть с нуля? И будет ли оно при этом работать?
  • Желание понимать, что же на самом деле происходит в системе. Процесс управления журналами событий (нет-нет, мы совсем не про SIEM!) также может быть не просто причиной расходования большого объема дисковых ресурсов, а приятной возможностью предсказать проблемы, обнаружить неожиданные угрозы и узнать результаты предоставления сервиса конкретному клиенту.
  • Желание быстро увидеть, как наш сервис выглядит со стороны и какова степень утилизации ресурсов в каждый момент времени. Ну, про мониторинг все и так знают: нет мониторинга -> нет сервиса -> нет проблем.

Конкретные советы

Отложив в сторону красивые истории про процессы, ITIL, и документооборот/согласование изменений комиссией, то в сухом остатке можно предложить такие варианты:

  1. Без контроля за конфигурацией большой распределенный сервис в ряде случаев рискует стать большой распределенной болью. Как минимум, обратите внимание на инструмент Ansible – он открыт, достаточно легко изучается, не требует внедрения в виде отдельной системы, при этом:
    1. С ходу позволяет документировать конфигурацию всей системы – серверного ПО, приложений (в том числе и CommuniGate Pro), сетевого оборудования.
    2. Позволяет автоматически распространить эти конфигурационные параметры на целевые узлы.
    3. Обеспечивает хранение такой конфигурации в простом YAML-файле, позволяет реализовать ее версионный контроль, разделение на тестовые – продуктивные зоны.
    4. Расширяет, и позволяет как самостоятельно добавлять в него новые возможности управления, так и в дальнейшем построить на его основе полноценную систему управления конфигурацией серверного linux-парка.
  2. Без сбора и возможности анализа журналов событий большая распределенная система станет черным ящиком. Не стоит ожидать, что в этом случае вы справитесь старым-добрым grep’ом, AWKом и черной консолью, но и не требуется сразу же подключать к этой истории прожорливые системы, новые статьи бюджетов и специалистов по информационной безопасности. В качестве стартовой точки мы рекомендуем обратить внимание на инструмент Graylog – также открытый, доступный, необлачный, и позволяющий:
    1. Принимать и агрегировать события из разных источников – от классического syslog до модного и прикладного gelf.
    2. Выполнять пост-обработку событий: разбирать их по атрибутам, преобразовывать, перекодировать, дополнять.
    3. Хранить терабайты собранных событий (благодаря Elasticsearch под капотом).
    4. При росте аппетитов масштабировать его, получая требуемую пропускную способность и длительность истории хранения.
    5. Анализировать хранимые данные через специализированный веб-интерфейс, быстро искать необходимую информацию.
    6. Отправлять через заданные каналы оповещения информацию о выявленных событиях.
    7. Собирать и отображать панели индикаторов, формируемые на основе хранимых данных.
  3. Само собой, не рассчитывать, что в 21 веке можно обойтись без старого доброго мониторинга – как в виде черного ящика, так и со сбором и хранением метрик производительности ?

Упомянутые выше инструменты достаточно просты в освоении, и не требуют безусловного привлечения стороннего интегратора, а при необходимости у “Диджитал Дизайн” есть ряд полезных дополнений и соответствующая экспертиза:

  • Специализированные модули Ansible управления конфигурацией ПО CommuniGate Pro и экспертиза в части их создания.
  • Набор компонентов “Логрус” для CGP и Graylog, значительно расширяющий возможности управления журналами событий CommuniGate Pro: распределенный сбор и фильтрация, специализированные задачи разбора событий, упрощенные средства поиска полезной информации и формирования отчетов.

 

Ну и, конечно же, у нас имеется большой опыт в части создания комплексных ИТ-инфраструктур и действительно крупных систем объединенных коммуникаций на базе CommuniGate Pro, в том числе:

  • создания полноценных систем управления конфигурацией;
  • создания масштабных и производительных решений по управлению журналами событий.
Related news
Artezio Named Among 15 Leading Java Development Companies
Auriga Showcased Its Digital Health Projects at Healthcare Summit
SearchInform solution is now available in Microsoft Azure