Контекстный движок

Контекстный движок улучшает взаимодействие с AI через три механизма: сжатие диалогов, обмен контекстом между профилями и локальный RAG (Retrieval-Augmented Generation).

Сжатие диалогов

Когда диалоги превышают пороговое значение токенов, Claudex использует LLM для создания резюме более старых сообщений, сохраняя последние нетронутыми.

[context.compression]
enabled = true
threshold_tokens = 50000    # сжимать при превышении этого порога токенов
keep_recent = 10            # всегда сохранять последние N сообщений
profile = "openrouter"      # переиспользовать base_url + api_key из профиля
model = "qwen/qwen-2.5-7b-instruct"  # переопределение модели (опционально)

Как это работает

Перед пересылкой запроса Claudex оценивает общее количество токенов
Если токенов больше threshold_tokens, более старые сообщения (сверх keep_recent) заменяются резюме
Резюме создаётся настроенной локальной LLM
Сжатый диалог затем пересылается провайдеру

Обмен контекстом между профилями

Обмен контекстом между разными профилями провайдеров в рамках одной сессии.

[context.sharing]
enabled = true
max_context_size = 2000    # максимальное количество токенов для внедрения из других профилей

Это полезно при переключении между провайдерами в середине задачи — релевантный контекст из предыдущих взаимодействий автоматически включается.

Локальный RAG

Индексирование локального кода и документации для поисково-дополненной генерации. Релевантные фрагменты кода автоматически внедряются в запросы.

[context.rag]
enabled = true
index_paths = ["./src", "./docs"]     # каталоги для индексирования
profile = "openrouter"                 # переиспользовать base_url + api_key из профиля
model = "openai/text-embedding-3-small"  # модель эмбеддингов
chunk_size = 512                       # размер фрагмента текста
top_k = 5                             # количество результатов для внедрения

Как это работает

При запуске Claudex индексирует файлы в index_paths с использованием модели эмбеддингов
Для каждого запроса сообщение пользователя преобразуется в эмбеддинг и сравнивается с индексом
Наиболее релевантные top-k фрагментов внедряются как дополнительный контекст в запрос
Провайдер получает более насыщенный контекст о вашей кодовой базе