Global_monitoring #24

Merged
otthorn merged 12 commits from Global_monitoring into master 2021-02-18 18:03:05 +01:00
Member

Coucou !

Merge de la branche qui a permis de mettre en place le rôle prometheus-federate, qui permet d'avoir un visuel de toutes les résidences et machines Aurore, d'un seul coup d'oeil.
Ajout d'une VM prometheus-ovh aussi, qui monitore les VM services aurores, et horus.
Et avec prometheus-federate on est averti quand un prometheus de résidence tombe, donc quand une résidence tombe aussi potentiellement.

Ajout d'une alerte sur le load des machines.

Voili voilou !

Coucou ! Merge de la branche qui a permis de mettre en place le rôle prometheus-federate, qui permet d'avoir un visuel de toutes les résidences et machines Aurore, d'un seul coup d'oeil. Ajout d'une VM prometheus-ovh aussi, qui monitore les VM services aurores, et horus. Et avec prometheus-federate on est averti quand un prometheus de résidence tombe, donc quand une résidence tombe aussi potentiellement. Ajout d'une alerte sur le load des machines. Voili voilou !
pz2891 added 11 commits 2021-02-17 19:49:07 +01:00
Fix restarting prometheus snmp (not installed)
Some checks failed
continuous-integration/drone/push Build is failing
6ec449c3b3
Add alert for load usage
Some checks failed
continuous-integration/drone/push Build is failing
61001e09f5
Fix CI warning from last commit
Some checks failed
continuous-integration/drone/push Build is failing
0b90c9944b
Remove percentage sign for load alert
Some checks failed
continuous-integration/drone/push Build is failing
b278b02bc2
Merge branch 'master' into Global_monitoring
All checks were successful
continuous-integration/drone/push Build is passing
continuous-integration/drone/pr Build is passing
74c30b81df
otthorn requested changes 2021-02-17 23:02:39 +01:00
otthorn left a comment
Owner

C'est bien dans l'ensemble mais il faut quelques modifs avant de pouvoir merge

  • supprimer le fichier roles/prometheus/tasks/main.yml.save
  • si la VM prometheus-fleming-fo.adm.auro.re existe encore il faut la nuke je pense et de toute façon la virer de Ansible. Ou alors discuter de la pertinence de ce genre de failover et l'installer partout. Mais avoir une infra non homogène c'est pas très joli.
  • remplacer !edc_unifi,!fleming_unifi,!pacaterie_unifi,!gs_unifi,!rives_unifi par !unifi dans les endroits où ça apparait encore
C'est bien dans l'ensemble mais il faut quelques modifs avant de pouvoir merge - [ ] supprimer le fichier `roles/prometheus/tasks/main.yml.save` - [ ] si la VM `prometheus-fleming-fo.adm.auro.re` existe encore il faut la nuke je pense et de toute façon la virer de Ansible. Ou alors discuter de la pertinence de ce genre de failover et l'installer partout. Mais avoir une infra non homogène c'est pas très joli. - [ ] remplacer `!edc_unifi,!fleming_unifi,!pacaterie_unifi,!gs_unifi,!rives_unifi` par `!unifi` dans les endroits où ça apparait encore
@ -0,0 +1,387 @@
# {{ ansible_managed }}
# TODOlist :
Owner

C'est pas super joli, mais c'est mieux que de ne pas le noter du tout 👍

C'est pas super joli, mais c'est mieux que de ne pas le noter du tout 👍
otthorn marked this conversation as resolved
@ -0,0 +128,4 @@
- 1.3.6.1.2.1.1.5.0
- 1.3.6.1.2.1.1.6.0
metrics:
# Pour faire une WifiMap un jour, on peut entrer la location dans la conf des bornes
Owner

Reste un commentaire ici, mais j'imagine que c'est un reliquat de erdnaxe et pas de toi.
C'est legay on va dire.

Reste un commentaire ici, mais j'imagine que c'est un reliquat de erdnaxe et pas de toi. C'est legay on va dire.
otthorn marked this conversation as resolved
otthorn changed title from Global_monitoring to WIP: Global_monitoring 2021-02-17 23:03:04 +01:00
pz2891 added 1 commit 2021-02-18 17:53:31 +01:00
Remove .save file; remove fo fleming prometheus
All checks were successful
continuous-integration/drone/push Build is passing
continuous-integration/drone/pr Build is passing
d7d0676f5e
otthorn closed this pull request 2021-02-18 18:01:44 +01:00
otthorn reopened this pull request 2021-02-18 18:02:38 +01:00
otthorn changed title from WIP: Global_monitoring to Global_monitoring 2021-02-18 18:02:59 +01:00
otthorn merged commit f49194b423 into master 2021-02-18 18:03:05 +01:00
otthorn deleted branch Global_monitoring 2021-02-18 18:03:24 +01:00
Sign in to join this conversation.
No reviewers
No labels
No milestone
No project
No assignees
2 participants
Notifications
Due date
The due date is invalid or out of range. Please use the format "yyyy-mm-dd".

No due date set.

Dependencies

No dependencies set.

Reference: aurore/ansible#24
No description provided.