Инциденты и подозрения
Инцидент — прерывание работы системы или снижение качества услуги. Инциденты требуют быстрой реакции, так как затрагивают многих пользователей и могут повлечь финансовые и репутационные потери.
В системе есть:
- Инциденты: когда сотрудник или пользователь наблюдают необычное поведение сервиса и самостоятельно сообщают об этом в FineDog.
Также инциденты могут заводиться по автоматизации.
Связанные инциденты могут быть объединены в группы.
Подробнее о работе с инцидентами - Нарушения соглашений: когда на юните нарушается SLO в течение любого времени.
- Подозрения: когда у юнита нарушаются SLO в течение указанного времени.
Также подозрения могут заводиться по автоматизации.
Подробнее о работе с подозрениями
info
Нарушения соглашений и подозрения по нарушениям появятся в следующих версиях.
Вы можете посмотреть информацию об инциденте, группе инцидентов или подозрении в разделе Инциденты. К событиям на юните можно перейти со страницы юнита: перейдите на вкладку События.
Статусная модель
В идеальном мире инциденты создаются на основе подозрений, поэтому описание статусной модели начинается со статусов подозрений.
- Появляется подозрение в статусе «Создано». Если при изучении карточки подозрения и метрик вы поняли, что в системе или услуге нет проблем, вы можете его отменить. Оно перейдет в статус «Отменено».
- Когда вы подтверждаете инцидент:
- Подозрение переходит в статус «Подтверждено».
- Создается инцидент в статусе «Решается». Если инцидент создан по ошибке, вы можете его отменить. Он перейдет в статус «Отменен».
- Когда влияние и последствия устранены, подтвердите это на странице инцидента.
Он перейдет в статус:
- «Решен» — если для инцидента нужен постанализ.
- «Завершен» — если постанализ не нужен.
- Если для инцидента нужен постанализ: инцидент автоматически перейдет в статус «Завершен», когда все action items в постанализе будут завершены.
