BYOK и провайдеры LLM
AiHummer никогда не требует платной модели. Из коробки он работает на свободных и локальных моделях и на транспорте через подписку Codex/ChatGPT, а если модель не подключена вовсе — рантайм откатывается на детерминированный mock, чтобы платформа всё равно запускалась и оставалась тестируемой. Когда же нужна конкретная модель, вы подключаете её сами — либо как конфигурацию на весь процесс, либо на арендатора через BYOK («bring your own key»).
Поддерживаемые провайдеры LLM
AiHummer общается с любым провайдером, у которого есть chat-API в стиле OpenAI, плюс с Anthropic и транспортом через подписку ChatGPT. На практике это покрывает:
| Провайдер | Как подключается | Примечания |
|---|---|---|
| Anthropic | Нативный API Anthropic | Модели Claude |
| OpenAI | Chat-API OpenAI | |
| Любой эндпоинт стандарта OpenAI-API | OpenAI-совместимый gateway URL | Локальные модели, OpenRouter, OpenAI-совместимый API Gemini и т. п. |
| Транспорт Codex / подписка ChatGPT | Транспорт на базе подписки | Использует подписку ChatGPT вместо тарифицируемого API-ключа |
[!WARNING] Платный API модели никогда не обязателен. AiHummer работает на свободных и локальных моделях и на транспорте через подписку Codex/ChatGPT, а если модель не настроена — рантайм использует детерминированный mock: gateway всё равно запускается и отвечает. BYOK и платные ключи полностью опциональны.
Подключение модели через переменные окружения
Модель выбирается четырьмя переменными окружения. Задайте провайдера и модель, укажите gateway URL для OpenAI-совместимых эндпоинтов и передайте ключ только если эндпоинту он нужен:
AIHUMMER_LLM_PROVIDER=openai
AIHUMMER_LLM_MODEL=gpt-4o-mini
AIHUMMER_LLM_GATEWAY_URL=https://api.openai.com/v1
AIHUMMER_OPENAI_API_KEY=sk-...
Для локального OpenAI-совместимого сервера укажите его gateway URL, а ключ обычно не нужен:
AIHUMMER_LLM_PROVIDER=openai
AIHUMMER_LLM_MODEL=qwen2.5-instruct
AIHUMMER_LLM_GATEWAY_URL=http://127.0.0.1:8080/v1
Если AIHUMMER_LLM_PROVIDER / AIHUMMER_LLM_MODEL отсутствуют, используется
детерминированный mock.
BYOK: ключи на арендатора
Если переменные окружения настраивают одну модель на весь процесс, то BYOK позволяет каждому арендатору задать свои собственные доступы к LLM. Ключи BYOK управляются через admin API:
GET /v1/admin/byok
POST /v1/admin/byok
Ключи BYOK хранятся в зашифрованном vault, как и любой другой доступ — они никогда не пишутся в логи и не попадают в контекст модели. Именно это позволяет multitenant-развёртыванию полностью разделять биллинг моделей и ключевой материал между клиентами.
Что выбрать: env или BYOK
- Используйте переменные
AIHUMMER_LLM_*для одно-арендаторной или дефолтной модели, которую должен использовать весь gateway. - Используйте BYOK, когда разным арендаторам нужны разные ключи, разные провайдеры или раздельный биллинг — ключ на арендатора переопределяет дефолт для этого арендатора.
[!TIP] Поскольку принимается любой эндпоинт стандарта OpenAI-API, вы можете поставить за
AIHUMMER_LLM_GATEWAY_URLлокальный сервер модели, OpenRouter или OpenAI-совместимый эндпоинт Gemini, ничего больше не меняя в AiHummer.
Связь с остальной моделью доступов
Ключи BYOK — это доступы к модели, и они живут в том же зашифрованном vault, что и Connections и общие/персональные секреты. Разница в scope: BYOK отвечает на вопрос какую модель и ключ использует этот арендатор, а scope персональный/общий отвечает под чьими доступами выполняется конкретный вызов инструмента.
Куда дальше
- Персональные и общие доступы
- Connections (OAuth2 на пользователя)
- Введение — принцип «без платных моделей» в контексте.