Vocabulaire

Alarme

Une alarme est le résultat du traitement des évènements par un moteur et sert à alerter sur un problème.

Elle est liée à une entité de type composant, ressource ou observateur.

Elle peut connaître de multiples changements d'états, de statuts et subir une suite d'actions (acquittement, snooze, changement de criticité, annulation, etc.), utilisateurs ou automatiques. L'ensemble de ces changements et actions s'appelle un cycle d'alarme.

On peut visualiser les alarmes via un widget bac à alarmes.

Vous pouvez consulter sa structure dans la documentation développeur.

Battement

Un moteur effectue une tâche périodique appelée battement (ou « beat ») à un intervalle régulier. L'intervalle typique est de 1 minute.

Composant

Un composant peut être soit :

  • Un type d'entité créé suite au traitement d'un évènement.
  • Un champ d'un évènement. Le plus souvent, il s'agit d'une machine ou d'un périphérique réseau (serveur, routeur, etc.). Une alarme peut être rattachée à un composant.

Context-Graph

Le context-graph est un schéma relationnel entre les entités de Canopsis. Il sert à grapher leur contexte. Il s'appuie sur les notions de impact et depends. Il est présent au sein de chaque entité et peut être visualisé via le widget explorateur de contexte.

Connecteur

Un connecteur peut être soit :

  • Un type d'entité créé suite au traitement d'un évènement. Il est le fruit de la concaténation des champs connector et connector_name.
  • Un champ d'un évènement. Le plus souvent, il s'agit du nom du logiciel qui envoie ses données à Canopsis. Il sert à créer l'entité connecteur.
  • Un script permettant d’envoyer à Canopsis des évènements à partir de sources d'informations extérieures.

Enrichissement

L'enrichissement est l'action d'ajouter des informations supplémentaires. On peut enrichir :

Entité

Les entités servent à structurer les alarmes. Elles sont liées entre elles via le context-graph. Elles peuvent permettre, via l'enrichissement de conserver des données statiques (emplacement du serveur, nom du client, etc.).

Les entités peuvent être visualisées via le widget explorateur de contexte

Les types d'entité sont :

Type d'entité Résulte du traitement d'un évènement Peut être lié à une alarme
composant
connecteur
observateur
ressource

Vous pouvez consulter la structure d'une entité dans la documentation développeur.

État

Une alarme a un état de criticité, indiquant la gravité de l'incident. Il y a actuellement 4 états possibles : 1 stable et 3 d'alerte.

  • 0 - Info (quand en cours)/ OK (quand résolue), stable
  • 1 - Minor, alerte
  • 2 - Major, alerte
  • 3 - Critical, alerte

Évènement

Un évènement est un message arrivant dans Canopsis.

Il est formatté en JSON et peut être de plusieurs types, avec leurs propres structures.

Les évènements de type check peuvent provenir d'une source externe, d'un connecteur (email, SNMP, etc.) ou de Canopsis lui-même. Ils aboutissent à la création ou la mise-à-jour d'une alarme dans le bac à alarmes.

Météo

La météo des services est un widget qui permet permet d'avoir une vue globale sur l'état d'un ensemble d'entités. Pour cela, elle affiche des tuiles dont la couleur est représentative de l'état des alarmes liées aux observateurs.

Moteur

Un moteur Canopsis consomme les évènements entrants pour les traiter, puis les acheminer vers le(s) moteur(s) suivant(s). Ils effectuent également une tâche périodique au battement et consomment leurs enregistrements en base de données lorsqu'ils sont disponibles. Vous pouvez consulter plus d'informations sur les moteurs dans la documentation du guide d'administration

Nom de connecteur

Un nom de connecteur (ou « connector name ») est le champ d'un évènement. Le plus souvent, il s'agit du nom du logiciel qui envoie ses données à Canopsis, complété par sa localisation ou sa numérotation (superviseur_lille ou superviseur_5 par exemple). Il sert à créer l'entité connecteur.

Observateur

Un observateur est une entité destinée à inclure d'autres entités dans son context-graph via des patterns. Ils peuvent être ajoutés via l'explorateur de contexte.

Ils peuvent être visualisés via la Météo de services.

Ressource

Une ressource peut être soit :

  • Un type d'entité créé suite au traitement d'un évènement. Il est le fruit de la concaténation des champs resource et component.
  • Un champ d'un évènement. Le plus souvent, il s'agit du nom de la vérification effectuée (RAM, DISK, PING, CPU, etc.). Une alarme peut être rattachée à une ressource.

Statut

Une alarme a un statut , indiquant la situation dans laquelle se trouve l'alarme indiquant un incident. Il y a actuellement 5 statuts possibles :

  • 0 - Off
  • 1 - On going
  • 2 - Stealthy
  • 3 - Bagot
  • 4 - Cancel

Off

Une alarme est considérée Off si elle est stable. C'est-à-dire que son état est stable à 0.

On going

Une alarme est considérée On going si son état est dans un état d'alerte (supérieur à 0).

Stealthy

Une alarme est considérée Stealthy si son état est passé d'alerte à stable dans un délai spécifié.

Si l'état de cette alarme est modifié à nouveau dans le délai spécifié, elle est toujours considérée Stealthy.

Une alarme restera Stealthy pendant une durée spécifiée et passera à Off si le dernier état était 0, On Going s'il s'agissait d'une alerte ou Bagot s'il se qualifie en tant que tel.

Bagot

Une alarme est considérée Bagot (ou en « flapping ») s'il est passé d'un état d'alerte à un état stable un nombre spécifique de fois sur une période donnée.

Cancel

Une alarme est considérée cancel si l'utilisateur l'a signalée comme tel à partir de l'interface utilisateur.

Après une période donnée, une alarme marquée comme cancel changera d'état pour être considérée comme résolue.


Dernière mise à jour: 2020-01-20