Przejdź do głównej zawartości

Silnik kontekstu

Silnik kontekstu wzbogaca interakcje z AI przez trzy mechanizmy: kompresje konwersacji, udostepnianie kontekstu miedzy profilami i lokalny RAG (Retrieval-Augmented Generation).

Gdy konwersacje przekrocza prog tokenow, Claudex uzywa LLM do podsumowania starszych wiadomosci, zachowujac nienaruszone najnowsze.

[context.compression]
enabled = true
threshold_tokens = 50000 # kompresuj, gdy laczna liczba tokenow przekroczy te wartosc
keep_recent = 10 # zawsze zachowuj ostatnie N wiadomosci
profile = "openrouter" # ponowne uzycie base_url + api_key profilu
model = "qwen/qwen-2.5-7b-instruct" # nadpisanie modelu (opcjonalne)
  1. Przed przekazaniem zadania Claudex szacuje laczna liczbe tokenow
  2. Jesli tokeny przekrocza threshold_tokens, starsze wiadomosci (poza keep_recent) sa zastepowane podsumowaniem
  3. Podsumowanie jest generowane przez skonfigurowany lokalny LLM
  4. Skompresowana konwersacja jest nastepnie przekazywana do dostawcy

Udostepniaj kontekst miedzy roznymi profilami dostawcow w ramach tej samej sesji.

[context.sharing]
enabled = true
max_context_size = 2000 # maksymalna liczba tokenow do wstrzykniecia z innych profili

Jest to przydatne podczas przelaczania sie miedzy dostawcami w trakcie zadania — odpowiedni kontekst z poprzednich interakcji jest automatycznie dolaczany.

Indeksuj lokalne kody i dokumentacje do generowania wspomaganego pobieraniem. Odpowiednie fragmenty kodu sa automatycznie wstrzykiwane do zadan.

[context.rag]
enabled = true
index_paths = ["./src", "./docs"] # katalogi do indeksowania
profile = "openrouter" # ponowne uzycie base_url + api_key profilu
model = "openai/text-embedding-3-small" # model osadzen
chunk_size = 512 # rozmiar fragmentu tekstu
top_k = 5 # liczba wynikow do wstrzykniecia
  1. Przy uruchomieniu Claudex indeksuje pliki w index_paths przy uzyciu modelu osadzen
  2. Dla kazdego zadania wiadomosc uzytkownika jest osadzana i porownywana z indeksem
  3. Najlepsze k najbardziej trafnych fragmentow jest wstrzykiwanych jako dodatkowy kontekst w zadaniu
  4. Dostawca otrzymuje bogatszy kontekst o bazie kodu