コンテキストエンジン

コンテキストエンジンは、会話圧縮、プロファイル間コンテキスト共有、ローカル RAG（検索拡張生成）の 3 つのメカニズムを通じて AI とのやり取りを強化します。

会話圧縮

会話がトークンしきい値を超えると、Claudex は LLM を使用して古いメッセージを要約し、最近のものをそのまま保持します。

[context.compression]
enabled = true
threshold_tokens = 50000    # 合計トークン数がこれを超えると圧縮
keep_recent = 10            # 常に最新 N 件のメッセージを保持
profile = "openrouter"      # プロファイルの base_url + api_key を再利用
model = "qwen/qwen-2.5-7b-instruct"  # モデルを上書き（任意）

動作の仕組み

リクエストを転送する前に、Claudex が合計トークン数を推定
トークン数が threshold_tokens を超えた場合、古いメッセージ（keep_recent を超えた分）が要約に置き換えられる
要約は設定されたローカル LLM によって生成される
圧縮された会話がプロバイダーに転送される

プロファイル間共有

同じセッション内の異なるプロバイダープロファイル間でコンテキストを共有します。

[context.sharing]
enabled = true
max_context_size = 2000    # 他のプロファイルから注入する最大トークン数

これはタスクの途中でプロバイダーを切り替える際に有用です。以前のやり取りからの関連コンテキストが自動的に含まれます。

ローカル RAG

検索拡張生成のためにローカルコードとドキュメントをインデックス化します。関連するコードスニペットがリクエストに自動的に注入されます。

[context.rag]
enabled = true
index_paths = ["./src", "./docs"]     # インデックス化するディレクトリ
profile = "openrouter"                 # プロファイルの base_url + api_key を再利用
model = "openai/text-embedding-3-small"  # エンベディングモデル
chunk_size = 512                       # テキストチャンクサイズ
top_k = 5                             # 注入する結果数

動作の仕組み

起動時に Claudex がエンベディングモデルを使用して index_paths 内のファイルをインデックス化
各リクエストに対して、ユーザーのメッセージがエンベディングされインデックスと比較される
最も関連性の高い上位 K 件のチャンクがリクエストの追加コンテキストとして注入される
プロバイダーがコードベースについてより豊かなコンテキストを受け取る