Einstein (плагин памяти)

Einstein — официальный плагин долговременной памяти AiHummer. Он даёт агенту устойчивую, доступную для поиска память, которая переживает перезапуски и переключение разговоров, и при этом память никогда не превращается в «чёрный ящик». Главное правило простое: источник истины — канонический Markdown, система индексирует и предлагает изменения, а каждое продвижение в долговременную память проходит проверку человеком.

Плагин работает host-native как отдельный небольшой Python-сервис (только стандартная библиотека — без тяжёлых фреймворков) и общается с gateway по контракту. Подсистема памяти внутри gateway (claims, выдача, data-fence) описана на странице концепции Память (Einstein); эта страница — про сам плагин, который её обеспечивает.

Факты

Поле	Значение
Версия	1.0.0
Порт	8820
Среда	Python (стандартная библиотека), host-native

Что это такое

Einstein хранит память в виде человекочитаемого Markdown — канонической записи, которую человек может открыть, прочитать и отредактировать. Поверх этой записи он строит механизмы, нужные агенту в момент хода:

Выдача (retrieval) — получить память, релевантную текущему разговору.
Поиск — полнотекстовый и по эмбеддингам поиск по сохранённым фактам.
Эмбеддинги — векторы для семантической выдачи, отдаются по HTTP.

Поскольку Markdown каноничен, в индексах нет ничего незаменимого: их можно перестроить из источника истины в любой момент, и проверяющий всегда читает тот же текст, что и агент.

Как используется

В момент хода gateway запрашивает у Einstein память, релевантную текущему контексту. Выдача приходит модели как результат инструмента, обёрнутый в data-fence, а не как внедрённые инструкции — поэтому вредоносная заметка, попавшая в память, не может перехватить управление агентом. Новые факты, замеченные в разговоре, извлекаются как утверждения (claims) с доказательствами и ставятся в очередь на проверку, а не пишутся в память напрямую.

[!NOTE] Система индексирует и предлагает, но никогда тихо не переписывает память. Продвижение утверждения в долговременную память — это осознанный шаг с проверкой человеком. Режим памяти (auto / review / off) и режим выдачи (fulltext / embedding) настраиваются в админке.

Сайдкар v2 (расширенный, флаги записи выключены)

Einstein поставляется с опциональной платформой памяти v2 с расширенными возможностями: извлечение утверждений, очередь проверки, проход «сна»/консолидации (dream), граф памяти и обнаружение противоречий. Это мощные функции, поэтому поставляются они консервативно.

[!WARNING] Все возможности записи сайдкара v2 выключены по умолчанию. Расширенные функции индексируют, анализируют и предлагают; они не изменяют каноническую память, пока оператор явно не включит соответствующий флаг и человек не одобрит изменение. Это сохраняет базовую гарантию: память никогда не переписывается у вас за спиной.

Установка

Установите Einstein в один клик из маркетплейса в админке. Host-native деплойер скачивает плагин, выполняет шаг установки, генерирует изолированный systemd-юнит и опрашивает health-эндпоинт сервиса, прежде чем пометить установку как готовую. Полный жизненный цикл — на странице Установка и обновления. Никаких контейнеров — Einstein работает как собственный systemd-сервис рядом с gateway.

Безопасность и ограничения

Источник истины — Markdown. Индексы и эмбеддинги выводимы; человек проверяет и редактирует именно канонический текст.
Без тихих перезаписей. Продвижение проходит проверку человеком; флаги записи v2 по умолчанию выключены.
Выдача в data-fence. Память доходит до модели как огороженный вывод инструмента, а не как инструкции, что блокирует косвенные инъекции в промпт.
Защищённый Web UI. UI проверки/управления плагина закрыт контролем доступа.
Host-native. Работает под systemd, не в контейнере.