Наблюдаемость
Модель наблюдаемости AiHummer — только push по OTLP. Gateway экспортирует телеметрию на эндпоинт OpenTelemetry, который вы настраиваете, — и не предоставляет эндпоинт для скрейпинга. Отправляйте данные в свой коллектор и визуализируйте их с помощью поставляемых дашбордов Grafana.
[!WARNING] Эндпоинта Prometheus
/metricsнет, как и pprof (/debug/pprof). Наблюдаемость работает только по push-модели OTLP — не настраивайте скрейп против gateway; вместо этого направьте AiHummer на ваш OTLP-коллектор.
Push по OTLP
Включается одной переменной:
# gateway.env — экспорт телеметрии в ваш OTLP-коллектор
AIHUMMER_OTEL_ENDPOINT=http://otel-collector:4317
Когда задан AIHUMMER_OTEL_ENDPOINT, gateway отправляет телеметрию в этот
коллектор. Оттуда маршрутизируйте её в свой бэкенд (Tempo, хранилище метрик,
логи) и в Grafana.
Дашборды Grafana
Готовые дашборды Grafana поставляются вместе с релизом. Импортируйте их в свой экземпляр Grafana, чтобы получить операционные представления без сборки панелей с нуля.
За чем следить
Это сигналы, которые говорят, что система здорова и ходы проходят:
| Сигнал | Почему важно |
|---|---|
| Латентность хода | Сквозная отзывчивость ходов агента |
| Доля ошибок | Падающие ходы / запросы — первый признак проблем |
| Диспозиции доставки | Доходят ли ответы реально до каналов |
| Глубина outbox / DLQ | Очередь недоставленных сообщений; растущий DLQ = доставка застряла |
Растущая глубина outbox или очереди мёртвых писем (DLQ) — самый явный ранний сигнал, что доставка копится; следите за ней во время выкаток и инцидентов.
Системные эндпоинты
Помимо OTLP gateway предоставляет небольшие HTTP-эндпоинты, полезные для проб, часов и клиентской диагностики:
| Метод | Эндпоинт | Назначение |
|---|---|---|
GET | /healthz | Liveness + версия |
GET | /readyz | Готовность (проверяет Postgres; 503 при недоступности) |
GET | /v1/ping | Лёгкая проверка доступности |
GET | /v1/time | Время сервера |
POST | /v1/client-log | Приём клиентских лог-событий |
Пробы здоровья и готовности подробно описаны в разделе systemd и health-проверки.
Куда дальше
- Пробы и предстартовый чеклист для продакшена: systemd и health-проверки.
- За чем следить во время скользящего обновления: Политика обновлений.