Monitoring

Comment fonctionne notre monitoring URL ?

Nos serveurs de monitoring vont effectuer périodiquement des requêtes sur une URL spécifiée. Si la page s'affiche correctement (code HTTP de retour 200) en moins de 10 secondes, les serveurs vérifient ensuite la présence d'une chaîne de caractère que nous avons repéré dans le code source de la page. Vous pouvez aussi faire en sorte de mettre en place le texte "Sonde Monitoring" dans un commentaire HTML en fin de page afin que nous vérifions sa présence.

Si une de ces conditions n'est pas remplie, nous serons alors alertés.

Qu'est-il possible de monitorer ?

Nous monitorons généralement un site par serveur ou à minima un site par version de PHP installée sur la machine.

Comment ajouter une URL au monitoring ?

a) Ajoutez la chaine de caractère "Sonde monitoring" sur votre page. Le texte n'a pas besoin d'être visible sur la page, seulement dans le code source.

b) Faites une demande à notre support en indiquant :

  • l'URL à monitorer
  • le serveur sur lequel se trouve ce site

Que monitorons-nous d'autre ?

Le monitoring est effectif suivant le forfait sélectionné dans votre contrat :

  • 24h sur 24
  • 5 jours sur 7 en heures ouvrées (de 9h à midi et de 14h à 18h)

Nous monitorons les services installés. Pour chaque élément des seuils d'alerte par défaut déclenchant l'équipe d'astreinte.

  • Supervision Hardware
    • État des disques (SATA / SAS / SSD / NVMe)
  • Supervision Système
    • Disponibilité (ping / SSH)
    • État des partitions (espace libre / quota utilisateur)
    • Niveau inode libre
    • Niveau de charges CPU / RAM / SWAP
    • Dérive horaire
    • Uptime du serveur
    • État des différents processus internes
  • Supervision Applicative
    • Test des URL (disponibilité, code d'erreur, délai, contenu)
    • Disponibilité et statut des applications installées comme Apache, Ngnix, Tomcat, Varnish, ElasticSearch, MySQL, PostgreSQL, Postfix, Qmail, etc.
    • Contrôle des systèmes de réplication distante présents sur le serveur (Heatbeat, DRBD, GlusterFS, MySQL, PostgreSQL, etc.)
  • Supervision Réseau
    • Interface et routage des IPFO (IP FailOver)
    • Pénalité antispam des IP

L'intégralité du monitoring est un outil développé par Cognix Systems, nous ne pouvons vous y donner accès.

Cependant vous pouvez consulter une majorité de ses éléments depuis l'outil de suivi Grafana

L'équipe d'astreinte

L'équipe d'astreinte est composée de l'ensemble des administrateurs / techniciens avec qui vous échangez par ticket. Chaque administrateur est d'astreinte une nuit par semaine et un week-end par mois (minimum).

Chaque équipe d'astreinte est composée systématiquement, par sécurité, de deux personnes. Cela permet d'assurer un débordement (surplus d'alertes), des cas plus techniques, des réparations chronophages. C'est une des raisons expliquant que la présence des administrateurs / techniciens peut être aléatoire (de par un repos compensatoire après des nuits régulièrement mouvementées) ou que vous pouvez réceptionner une même alerte par un second technicien le lendemain matin.

Quel contact en cas d'alerte ?

Lorsque nous sommes alertés, et en fonction de la criticité de l'alerte, nous sommes amenés à vous contacter. Vous pouvez choisir qui doit être contacté en cochant la case correspondante dans votre profil.