Skip to main content

Инциденты и подозрения

Инцидент — прерывание работы системы или снижение качества услуги. Инциденты требуют быстрой реакции, так как затрагивают многих пользователей и могут повлечь финансовые и репутационные потери.

В системе есть:

  • Инциденты: когда сотрудник или пользователь наблюдают необычное поведение сервиса и самостоятельно сообщают об этом в FineDog. Также инциденты могут заводиться по автоматизации. Связанные инциденты могут быть объединены в группы.
    Подробнее о работе с инцидентами
  • Нарушения соглашений: когда на юните нарушается SLO в течение любого времени.
  • Подозрения: когда у юнита нарушаются SLO в течение указанного времени. Также подозрения могут заводиться по автоматизации.
    Подробнее о работе с подозрениями
info

Нарушения соглашений и подозрения по нарушениям появятся в следующих версиях.

Вы можете посмотреть информацию об инциденте, группе инцидентов или подозрении в разделе Инциденты. К событиям на юните можно перейти со страницы юнита: перейдите на вкладку События.

Статусная модель

В идеальном мире инциденты создаются на основе подозрений, поэтому описание статусной модели начинается со статусов подозрений.

  1. Появляется подозрение в статусе «Создано». Если при изучении карточки подозрения и метрик вы поняли, что в системе или услуге нет проблем, вы можете его отменить. Оно перейдет в статус «Отменено».
  2. Когда вы подтверждаете инцидент:
    • Подозрение переходит в статус «Подтверждено».
    • Создается инцидент в статусе «Решается». Если инцидент создан по ошибке, вы можете его отменить. Он перейдет в статус «Отменен».
  3. Когда влияние и последствия устранены, подтвердите это на странице инцидента. Он перейдет в статус:
    • «Решен» — если для инцидента нужен постанализ.
    • «Завершен» — если постанализ не нужен.
  4. Если для инцидента нужен постанализ: инцидент автоматически перейдет в статус «Завершен», когда все action items в постанализе будут завершены.