SIP-телефония позволяет агенту AiHummer принимать и совершать реальные
телефонные звонки. Агент слушает звонящего, выполняет обычный ход (turn) и
проговаривает ответ — полноценный голосовой диалог по телефонной сети.
Канал поставляется как коннектор из встроенного
Marketplace и работает host-native. Он
настраивается в Admin UI, как любой другой канал.
Нейтральность к оператору
SIP нейтрален к оператору: AiHummer подключается к любому стандартному
SIP-транку, без привязки к оператору связи. Используйте провайдера, который у
вас уже есть, или разверните собственную АТС — коннектор не зависит ни от одного
конкретного телефонного вендора.
Порты и рантайм
Порт
Назначение
8830
Health-эндпоинт коннектора
5062
Прослушивание SIP
4444
Управление baresip
Голосовой стек собран из baresip для SIP-сигнализации и медиа, устройства
ALSA loopback для маршрутизации звука и Python-моста, который соединяет
аудио звонка с ходом агента.
Возможности во время звонка
Пока звонок активен, у агента есть специфичные для звонка инструменты и поведение:
ask_assistant — выполнить ход агента по тому, что только что сказал
звонящий.
send_dtmf — отправить тоны DTMF (для навигации по IVR или ввода с
клавиатуры).
Запись звонка.
Резюме после звонка, формируемое по его завершении.
[!NOTE]
На этом канале агент поддерживает только STT, TTS, barge-in, DTMF и запись.
Диаризация спикеров, перевод и клонирование голоса — это core/sidecar
голосовые возможности, они не входят в коннектор SIP.
Речевые движки
Доступны два речевых движка; выбирайте по требованиям к задержке и суверенности:
yandex — облачный движок реального времени.
local — полностью self-hosted: faster-whisper для распознавания речи
и edge-tts для синтеза.
[!TIP]
Движок local держит голос целиком на вашей инфраструктуре, в соответствии с
принципом AiHummer «без обязательных платных моделей».
**SIP-телефония позволяет агенту AiHummer принимать и совершать реальные
телефонные звонки.** Агент слушает звонящего, выполняет обычный ход (turn) и
проговаривает ответ — полноценный голосовой диалог по телефонной сети.
Канал поставляется как **коннектор из встроенного
[Marketplace](/v1.0/marketplace/overview-tiers)** и работает host-native. Он
настраивается в Admin UI, как любой другой канал.
## Нейтральность к оператору
SIP **нейтрален к оператору**: AiHummer подключается к **любому стандартному
SIP-транку**, **без привязки к оператору связи**. Используйте провайдера, который у
вас уже есть, или разверните собственную АТС — коннектор не зависит ни от одного
конкретного телефонного вендора.
## Порты и рантайм
| Порт | Назначение |
|---|---|
| 8830 | Health-эндпоинт коннектора |
| 5062 | Прослушивание SIP |
| 4444 | Управление baresip |
Голосовой стек собран из **baresip** для SIP-сигнализации и медиа, устройства
**ALSA loopback** для маршрутизации звука и **Python-моста**, который соединяет
аудио звонка с ходом агента.
## Возможности во время звонка
Пока звонок активен, у агента есть специфичные для звонка инструменты и поведение:
- **`ask_assistant`** — выполнить ход агента по тому, что только что сказал
звонящий.
- **`send_dtmf`** — отправить тоны DTMF (для навигации по IVR или ввода с
клавиатуры).
- **Запись** звонка.
- **Резюме после звонка**, формируемое по его завершении.
> [!NOTE]
> На этом канале агент поддерживает **только STT, TTS, barge-in, DTMF и запись**.
> Диаризация спикеров, перевод и клонирование голоса — это **core/sidecar**
> голосовые возможности, они **не** входят в коннектор SIP.
## Речевые движки
Доступны два речевых движка; выбирайте по требованиям к задержке и суверенности:
- **`yandex`** — облачный движок реального времени.
- **`local`** — полностью self-hosted: **faster-whisper** для распознавания речи
и **edge-tts** для синтеза.
> [!TIP]
> Движок `local` держит голос целиком на вашей инфраструктуре, в соответствии с
> принципом AiHummer «без обязательных платных моделей».
## Куда дальше
- Об установке коннекторов: [Marketplace](/v1.0/marketplace/overview-tiers).
- Для диаризации, перевода и клонирования голоса см. раздел Voice.
- Для текстовых каналов см. [Telegram](/v1.0/channels/telegram) и
[MAX](/v1.0/channels/max).