Installation Prometheus-postgres-exporter #53

Merged
pz2891 merged 29 commits from prometheus_postgres_exporter into master 3 years ago
pz2891 commented 3 years ago
Collaborator

Hello !
[x] Installation de postgres-exporter (package debian) sur les VM de bdd (groupe bdd: re2o-db, bdd.adm.auro.re, bdd-ovh.adm.auro.re), et les VM radius (nouveau groupe fait pour)
[x] Découpe des alertes en plusieurs fichiers
[x] Création d'alertes pour Docker
[x] Création d'alertes pour Postgres (+ adaptations)

Hello ! [x] Installation de postgres-exporter (package debian) sur les VM de bdd (groupe bdd: re2o-db, bdd.adm.auro.re, bdd-ovh.adm.auro.re), et les VM radius (nouveau groupe fait pour) [x] Découpe des alertes en plusieurs fichiers [x] Création d'alertes pour Docker [x] Création d'alertes pour Postgres (+ adaptations)
pz2891 added 16 commits 3 years ago
pz2891 added 1 commit 3 years ago
continuous-integration/drone/push Build is passing Details
continuous-integration/drone/pr Build is passing Details
8c666151d6
Merge branch 'master' into prometheus_postgres_exporter
pz2891 requested review from jeltz 3 years ago
pz2891 requested review from otthorn 3 years ago
otthorn approved these changes 3 years ago
otthorn left a comment
Owner

Quelques petits choses à discuter. Je ne sais pas si j'ai raison pour les traductions mais ça vaut le coup de se poser la question je pense.

Sinon c'est très bien dans son ensemble 👍

Quelques petits choses à discuter. Je ne sais pas si j'ai raison pour les traductions mais ça vaut le coup de se poser la question je pense. Sinon c'est très bien dans son ensemble 👍
@ -88,4 +123,3 @@
- key: 05-prometheus
message: >-
Prometheus est déployé sur cette machine (voir /etc/prometheus)
...
Owner

Pourquoi avoir retirer ça ?
C'est la fin correct pour un fichier yaml.

Pourquoi avoir retirer ça ? C'est la fin correct pour un fichier yaml.
pz2891 marked this conversation as resolved
@ -0,0 +17,4 @@
severity: critical
annotations:
summary: >-
Container Docker mort
Owner

éteind ?

éteind ?
Owner

Je sais pas trop, je trouve que mort en français ça fait bizzare. Mais en même temps "dead" semble être le terme correct en Anglais.

Je sais pas trop, je trouve que mort en français ça fait bizzare. Mais en même temps "dead" semble être le terme correct en Anglais.
Owner

Pour postgres en dessous on utilise "down", ce qui est un Anglissisme mais c'est pas mal.
Sinon on peut dire "tombé" qui est un traduction un peu abusive, mais ça je trouve pas ça choquant.

Pour postgres en dessous on utilise "down", ce qui est un Anglissisme mais c'est pas mal. Sinon on peut dire "tombé" qui est un traduction un peu abusive, mais ça je trouve pas ça choquant.
pz2891 marked this conversation as resolved
@ -0,0 +43,4 @@
severity: critical
annotations:
summary: >-
Container Docker utilise beaucoup de CPU
Owner

Faudrait peut être faire des phrases.

C'est comme si on disait "Server utilise beaucoup de CPU", c'est pas syntaxiquement correct.
"Le container Docker utilise beaucoup de CPU" peut etre ?

Faudrait peut être faire des phrases. C'est comme si on disait "Server utilise beaucoup de CPU", c'est pas syntaxiquement correct. "Le container Docker utilise beaucoup de CPU" peut etre ?
pz2891 marked this conversation as resolved
@ -0,0 +55,4 @@
severity: warning
annotations:
summary: >-
La table n'a pas été aspirée depuis 24h
Owner

Je suis pas sûr que des gens utilisent vraiment "aspirée" pour traduire "autovacuum"

https://docs.postgresql.fr/8.1/runtime-config-autovacuum.html (seul source que j'ai trouvé en français)

Je suis pas sûr que des gens utilisent vraiment "aspirée" pour traduire "autovacuum" https://docs.postgresql.fr/8.1/runtime-config-autovacuum.html (seul source que j'ai trouvé en français)
pz2891 marked this conversation as resolved
@ -0,0 +93,4 @@
severity: warning
annotations:
summary: >-
PostgreSQL a des cadenas morts
Owner

Pareil je pense pas que ça se traduise

Source random https://forum.postgresql.fr/viewtopic.php?id=5643

Pareil je pense pas que ça se traduise Source random https://forum.postgresql.fr/viewtopic.php?id=5643
pz2891 marked this conversation as resolved
@ -0,0 +128,4 @@
severity: critical
annotations:
summary: >-
Réplication de Postgresql WALE stopée
Owner

WALE ?
https://www.postgresql.org/search/?u=%2Fdocs%2F13%2F&q=WALE

WAL peut être ?
Sinon je ne sais pas ce que c'est.

WALE ? https://www.postgresql.org/search/?u=%2Fdocs%2F13%2F&q=WALE WAL peut être ? Sinon je ne sais pas ce que c'est.
pz2891 commented 3 years ago
Poster
Collaborator
J'ai repris la source : https://awesome-prometheus-alerts.grep.to/rules.html#rule-postgresql-15
pz2891 marked this conversation as resolved
@ -0,0 +183,4 @@
severity: critical
annotations:
summary: >-
Split Brain, trop de bases de données Postgresql primaires en mode lecture-écriture
Owner

proposition: "Split Brain : trop de bases [...]"

proposition: "Split Brain : trop de bases [...]"
pz2891 marked this conversation as resolved
@ -0,0 +210,4 @@
severity: critical
annotations:
summary: >-
Trop de verrous acquis sur la base de données.
Owner

Pareil, je ne pense pas que ça se traduise. Ou alors peut etre plutot par "Verouillages" non ?
J'ai pas de source pour ça.

Pareil, je ne pense pas que ça se traduise. Ou alors peut etre plutot par "Verouillages" non ? J'ai pas de source pour ça.
pz2891 marked this conversation as resolved
pz2891 added 5 commits 3 years ago
pz2891 added 3 commits 3 years ago
continuous-integration/drone/push Build is failing Details
continuous-integration/drone/pr Build is failing Details
fde52f2e42
Alerts repository owned by prometheus
pz2891 added 1 commit 3 years ago
continuous-integration/drone/push Build is failing Details
continuous-integration/drone/pr Build is failing Details
1b0bff4c51
Fix deployment and add prometheus groups for hosts
pz2891 added 1 commit 3 years ago
continuous-integration/drone/push Build is failing Details
continuous-integration/drone/pr Build is failing Details
013743f910
typo in docker rules
pz2891 added 2 commits 3 years ago
continuous-integration/drone/push Build is failing Details
continuous-integration/drone/pr Build is failing Details
f409fb53cb
remove port for docker
jeltz approved these changes 3 years ago
@ -22,0 +21,4 @@
notify: Restart Prometheus
- name: Creates directory for alerts
file:
jeltz commented 3 years ago
Owner

Ça pourrait être bien de préciser le propriétaire et le groupe du dossier.

Ça pourrait être bien de préciser le propriétaire et le groupe du dossier.
pz2891 marked this conversation as resolved
@ -22,0 +26,4 @@
state: directory
mode: 0644
- name: Remove old files
jeltz commented 3 years ago
Owner

Est-ce que c'est la peine de garder ces règles une fois que ça a été exécuté une fois sur le parc ?

Peut-être que le fichier alert.rules.yml est créé par défaut dans l'installation Debian ?

Est-ce que c'est la peine de garder ces règles une fois que ça a été exécuté une fois sur le parc ? Peut-être que le fichier `alert.rules.yml` est créé par défaut dans l'installation Debian ?
pz2891 marked this conversation as resolved
@ -76,2 +104,4 @@
when: prometheus_docker_targets is defined
- name: Configure Prometheus postgres monitoring
copy:
jeltz commented 3 years ago
Owner

Ajout propriétaire et groupe ?

Ajout propriétaire et groupe ?
@ -0,0 +18,4 @@
annotations:
summary: >-
Le container Docker est éteint / tombé
(instance {{ raw('$labels.instance') }}, container {{ raw('$labels.name') }})
jeltz commented 3 years ago
Owner

Pas la peine de mettre l'instance, on l'affiche déjà avec Alertbot automatiquemenet.

Pas la peine de mettre l'instance, on l'affiche déjà avec Alertbot automatiquemenet.
pz2891 marked this conversation as resolved
@ -0,0 +28,4 @@
annotations:
summary: >-
Le container Docker redémarre souvent
(instance {{ raw('$labels.instance') }}, container {{ raw('$labels.name') }})
jeltz commented 3 years ago
Owner

Idem (instance superflue).

Idem (instance superflue).
pz2891 marked this conversation as resolved
@ -0,0 +44,4 @@
annotations:
summary: >-
Le container Docker utilise beaucoup de CPU
(instance {{ raw('$labels.instance') }}, container {{ raw('$labels.name') }},
jeltz commented 3 years ago
Owner

Idem (instance superflue).

Idem (instance superflue).
pz2891 marked this conversation as resolved
@ -0,0 +15,4 @@
labels:
severity: critical
annotations:
summary: Serveur PostgreSQL down (instance {{ raw('$labels.instance') }})
jeltz commented 3 years ago
Owner

Idem (instance superflue).

Idem (instance superflue).
pz2891 marked this conversation as resolved
@ -0,0 +23,4 @@
labels:
severity: critical
annotations:
summary: Serveur PostgreSQL redémarré (instance {{ raw('$labels.instance') }})
jeltz commented 3 years ago
Owner

Idem (instance superflue).

Idem (instance superflue).
pz2891 marked this conversation as resolved
@ -0,0 +31,4 @@
labels:
severity: critical
annotations:
summary: Erreur dans l'exporter Postgresql (instance {{ raw('$labels.instance') }})
jeltz commented 3 years ago
Owner

Idem (instance superflue).

Idem (instance superflue).
pz2891 marked this conversation as resolved
@ -0,0 +44,4 @@
annotations:
summary: >-
La réplication PostgreSQL lag ({{ raw('$value') }} > 30s)
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname')}} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" en français ?

Idem (instance superflue). Mettre "database" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +56,4 @@
annotations:
summary: >-
Le démon autovacuum n'a pas été lancé depuis 24h
(Instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" en français ?

Idem (instance superflue). Mettre "database" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +68,4 @@
annotations:
summary: >-
Table non-analysée depuis 24h
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }})
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" en français ?

Idem (instance superflue). Mettre "database" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +84,4 @@
summary: >-
PostgreSQL a trop de connexions
({{ raw('$value | printf "%.1f"') }} > 80%)
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }})
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" en français ?

Idem (instance superflue). Mettre "database" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +94,4 @@
annotations:
summary: >-
PostgreSQL a plus de 5 deadlocks.
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" en français ?

Idem (instance superflue). Mettre "database" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +104,4 @@
annotations:
summary: >-
Présence de requêtes lentes (slow-queries)
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" en français ?

Idem (instance superflue). Mettre "database" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +119,4 @@
annotations:
summary: >-
PostgreSQL a un taux de retour en arrière (rollback) élevé
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }}, value {{ raw('$value | printf "%.1f"') }} %)
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" et "value" en français ?

Idem (instance superflue). Mettre "database" et "value" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +129,4 @@
annotations:
summary: >-
Réplication de PostgreSQL WALE stopée
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" en français ?
"stoppée".

Idem (instance superflue). Mettre "database" en français ? "stoppée".
pz2891 marked this conversation as resolved
@ -0,0 +139,4 @@
annotations:
summary: >-
Beaucoup de requêtes PostgreSQL sont timeout
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }}, value {{ raw('$value | printf "%.1f"') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" et "value" en français ?

Idem (instance superflue). Mettre "database" et "value" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +149,4 @@
annotations:
summary: >-
PostgreSQL a un fort taux de deadlock
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }}, value {{ raw('$value | printf "%.1f"') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" et "value" en français ?

Idem (instance superflue). Mettre "database" et "value" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +160,4 @@
# labels:
# severity: critical
# annotations:
# summary: La réplication Postgresql a des octets de retard (instance {{ raw('$labels.name') }}, value {{ raw('$value') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" et "value" en français ?

Idem (instance superflue). Mettre "database" et "value" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +174,4 @@
annotations:
summary: >-
Les tuples morts PostgreSQL sont trop volumineux
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }}, value {{ raw('$value | printf "%.1f"') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" et "value" en français ?

Idem (instance superflue). Mettre "database" et "value" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +184,4 @@
annotations:
summary: >-
Split Brain : trop de bases de données PostgreSQL primaires en mode lecture-écriture
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }}, value {{ raw('$value') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" et "value" en français ?

Idem (instance superflue). Mettre "database" et "value" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +197,4 @@
annotations:
summary: >-
Le serveur de secours PostgreSQL a été promu comme nœud principal
(instance {{ raw('$labels.instance') }}, database {{ raw('$labels.datname') }}, value {{ raw('$value') }})
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" et "value" en français ?

Idem (instance superflue). Mettre "database" et "value" en français ?
pz2891 marked this conversation as resolved
@ -0,0 +213,4 @@
Trop de deadlocks acquis sur la base de données.
Si cette alerte se produit fréquemment, nous devrons peut-être augmenter
le paramètre postgres max_locks_per_transaction
(instance {{ raw('$labels.instance') }}, value = {{ raw('$value | printf "%.1f"') }} )
jeltz commented 3 years ago
Owner

Idem (instance superflue).
Mettre "database" et "value" en français ?

Idem (instance superflue). Mettre "database" et "value" en français ?
pz2891 marked this conversation as resolved
pz2891 merged commit 1520ad92c8 into master 3 years ago
pz2891 deleted branch prometheus_postgres_exporter 3 years ago

Reviewers

otthorn approved these changes 3 years ago
jeltz approved these changes 3 years ago
continuous-integration/drone/push Build is failing
continuous-integration/drone/pr Build is failing
The pull request has been merged as 1520ad92c8.
Sign in to join this conversation.
No reviewers
No Label
No Milestone
No Assignees
3 Participants
Notifications
Due Date
The due date is invalid or out of range. Please use the format 'yyyy-mm-dd'.

No due date set.

Dependencies

No dependencies set.

Reference: aurore/ansible#53
Loading…
There is no content yet.