Einstein (плагин памяти)
Einstein — официальный плагин долговременной памяти AiHummer. Он даёт агенту устойчивую, доступную для поиска память, которая переживает перезапуски и переключение разговоров, и при этом память никогда не превращается в «чёрный ящик». Главное правило простое: источник истины — канонический Markdown, система индексирует и предлагает изменения, а каждое продвижение в долговременную память проходит проверку человеком.
Плагин работает host-native как отдельный небольшой Python-сервис (только стандартная библиотека — без тяжёлых фреймворков) и общается с gateway по контракту. Подсистема памяти внутри gateway (claims, выдача, data-fence) описана на странице концепции Память (Einstein); эта страница — про сам плагин, который её обеспечивает.
Факты
| Поле | Значение |
|---|---|
| Версия | 1.0.0 |
| Порт | 8820 |
| Среда | Python (стандартная библиотека), host-native |
Что это такое
Einstein хранит память в виде человекочитаемого Markdown — канонической записи, которую человек может открыть, прочитать и отредактировать. Поверх этой записи он строит механизмы, нужные агенту в момент хода:
- Выдача (retrieval) — получить память, релевантную текущему разговору.
- Поиск — полнотекстовый и по эмбеддингам поиск по сохранённым фактам.
- Эмбеддинги — векторы для семантической выдачи, отдаются по HTTP.
Поскольку Markdown каноничен, в индексах нет ничего незаменимого: их можно перестроить из источника истины в любой момент, и проверяющий всегда читает тот же текст, что и агент.
Как используется
В момент хода gateway запрашивает у Einstein память, релевантную текущему контексту. Выдача приходит модели как результат инструмента, обёрнутый в data-fence, а не как внедрённые инструкции — поэтому вредоносная заметка, попавшая в память, не может перехватить управление агентом. Новые факты, замеченные в разговоре, извлекаются как утверждения (claims) с доказательствами и ставятся в очередь на проверку, а не пишутся в память напрямую.
[!NOTE] Система индексирует и предлагает, но никогда тихо не переписывает память. Продвижение утверждения в долговременную память — это осознанный шаг с проверкой человеком. Режим памяти (auto / review / off) и режим выдачи (fulltext / embedding) настраиваются в админке.
Сайдкар v2 (расширенный, флаги записи выключены)
Einstein поставляется с опциональной платформой памяти v2 с расширенными возможностями: извлечение утверждений, очередь проверки, проход «сна»/консолидации (dream), граф памяти и обнаружение противоречий. Это мощные функции, поэтому поставляются они консервативно.
[!WARNING] Все возможности записи сайдкара v2 выключены по умолчанию. Расширенные функции индексируют, анализируют и предлагают; они не изменяют каноническую память, пока оператор явно не включит соответствующий флаг и человек не одобрит изменение. Это сохраняет базовую гарантию: память никогда не переписывается у вас за спиной.
Установка
Установите Einstein в один клик из маркетплейса в админке. Host-native деплойер скачивает плагин, выполняет шаг установки, генерирует изолированный systemd-юнит и опрашивает health-эндпоинт сервиса, прежде чем пометить установку как готовую. Полный жизненный цикл — на странице Установка и обновления. Никаких контейнеров — Einstein работает как собственный systemd-сервис рядом с gateway.
Безопасность и ограничения
- Источник истины — Markdown. Индексы и эмбеддинги выводимы; человек проверяет и редактирует именно канонический текст.
- Без тихих перезаписей. Продвижение проходит проверку человеком; флаги записи v2 по умолчанию выключены.
- Выдача в data-fence. Память доходит до модели как огороженный вывод инструмента, а не как инструкции, что блокирует косвенные инъекции в промпт.
- Защищённый Web UI. UI проверки/управления плагина закрыт контролем доступа.
- Host-native. Работает под systemd, не в контейнере.