Netdata i alerty ntfy¶
Netdata zbiera metryki hosta, kontenerów Dockera, PostgreSQL i nginx w rozdzielczości 1s, ma setki gotowych reguł health i wysyła push na telefon przez publiczny ntfy.sh.
Retencja (tiered storage)¶
Ostatnie godziny w 1s, dni w 1m, tygodnie/miesiące w 1h — w wolumenie netdata_lib
(~512MB sufit per dbengine tier 0 retention size w netdata.conf).
Config ${BPP_CONFIGS_DIR}/netdata/netdata.conf jest renderowany z
defaults/netdata/netdata.conf.tpl i force-syncowany (patrz
Architektura konfiguracji).
Nie edytuj netdata.conf ręcznie
Strój przez .env:
NETDATA_DBENGINE_TIER0_RETENTION_MB— rozmiar retencji tier 0NETDATA_DBENGINE_PAGE_CACHE_MB— cache stron
Przycisk „View node" w ntfy¶
[registry] jest włączony, a registry to announce wskazuje https://<host>/netdata,
żeby przycisk „View node" w powiadomieniu ntfy przekierowywał do lokalnej Netdaty
zamiast registry.my-netdata.io. Wymaga jednorazowej wizyty na dashboardzie z danej
przeglądarki — rejestr zapisuje wtedy URL per cookie.
Alerty¶
- Wbudowane reguły health w agencie (setki gotowych defaultów).
- Custom alerty w
${BPP_CONFIGS_DIR}/netdata/health.d/. - Push przez
health_alarm_notify.conf(sourced jako bash, kanał ntfy z${NTFY_SERVER}/${NTFY_TOPIC}).
Alerty na komórkę¶
Netdata wysyła push na publiczny ntfy.sh. Topic (sekret) jest generowany losowo przy
make init-configs, przechowywany jako NTFY_TOPIC w ${BPP_CONFIGS_DIR}/.env.
Subskrybuj w aplikacji ntfy: https://ntfy.sh/<NTFY_TOPIC>. Test:
Kolektory go.d¶
W ${BPP_CONFIGS_DIR}/netdata/go.d/ (nadpisują wbudowane defaulty mountem RO):
| Plik | Co zbiera |
|---|---|
postgres.conf |
metryki PostgreSQL (DSN z .env; internal i external mode) |
nginx.conf |
live metryki połączeń z endpointu stub_status (osobny server { listen 8090; } w default.conf.template; port nie publikowany — osiągalny tylko w sieci Dockera: netdata → webserver:8090) |
web_log.conf |
metryki z parsowania access logu nginx (kody HTTP, metody, bandwidth, percentyle czasów) → wbudowane alerty na 5xx/latencje. Źródło: /var/log/nginx-shared/bpp_access.log |
web_log nie dubluje Loki — Loki trzyma surowe linie do przeszukiwania, web_log
liczy metryki @1s i alertuje na ntfy.
Dedykowany użytkownik monitoringu PostgreSQL¶
W trybie internal dbserver po wdrożeniu uruchom raz:
Tworzy read-only rolę bpp_monitor używaną przez kolektor go.d/postgres i datasource
Grafany (zamiast superusera aplikacji).