Motore di contesto
Il motore di contesto arricchisce le tue interazioni AI attraverso tre meccanismi: compressione delle conversazioni, condivisione del contesto tra profili e RAG locale (Retrieval-Augmented Generation).
Compressione delle conversazioni
Sezione intitolata “Compressione delle conversazioni”Quando le conversazioni superano una soglia di token, Claudex usa un LLM per riassumere i messaggi piu vecchi, mantenendo intatti quelli recenti.
[context.compression]enabled = truethreshold_tokens = 50000 # comprimi quando i token totali superano questo valorekeep_recent = 10 # mantieni sempre gli ultimi N messaggiprofile = "openrouter" # riutilizza base_url + api_key di un profilomodel = "qwen/qwen-2.5-7b-instruct" # override modello (opzionale)Come funziona
Sezione intitolata “Come funziona”- Prima di inoltrare una richiesta, Claudex stima il conteggio totale dei token
- Se i token superano
threshold_tokens, i messaggi piu vecchi (oltrekeep_recent) vengono sostituiti con un riassunto - Il riassunto viene generato dall’LLM locale configurato
- La conversazione compressa viene poi inoltrata al fornitore
Condivisione tra profili
Sezione intitolata “Condivisione tra profili”Condividi il contesto tra diversi profili fornitore all’interno della stessa sessione.
[context.sharing]enabled = truemax_context_size = 2000 # token massimi da iniettare da altri profiliUtile quando si cambia fornitore a meta attivita: il contesto rilevante delle interazioni precedenti viene incluso automaticamente.
RAG locale
Sezione intitolata “RAG locale”Indicizza codice e documentazione locali per la generazione arricchita con recupero. I frammenti di codice rilevanti vengono automaticamente iniettati nelle richieste.
[context.rag]enabled = trueindex_paths = ["./src", "./docs"] # directory da indicizzareprofile = "openrouter" # riutilizza base_url + api_key di un profilomodel = "openai/text-embedding-3-small" # modello di embeddingchunk_size = 512 # dimensione del chunk di testotop_k = 5 # numero di risultati da iniettareCome funziona
Sezione intitolata “Come funziona”- All’avvio, Claudex indicizza i file in
index_pathsusando il modello di embedding - Per ogni richiesta, il messaggio dell’utente viene embeddato e confrontato con l’indice
- I top-k chunk piu rilevanti vengono iniettati come contesto aggiuntivo nella richiesta
- Il fornitore riceve un contesto piu ricco sulla tua codebase