Moteur de contexte
Le moteur de contexte ameliore vos interactions IA grace a trois mecanismes : la compression de conversation, le partage de contexte inter-profils, et le RAG local (Retrieval-Augmented Generation).
Compression de conversation
Section intitulée « Compression de conversation »Lorsque les conversations depassent un seuil de tokens, Claudex utilise un LLM pour resumer les messages plus anciens, en conservant les plus recents intacts.
[context.compression]enabled = truethreshold_tokens = 50000 # compresser quand le total de tokens depasse ce seuilkeep_recent = 10 # toujours conserver les N derniers messagesprofile = "openrouter" # reutiliser le base_url + api_key d'un profilmodel = "qwen/qwen-2.5-7b-instruct" # remplacer le modele (optionnel)Fonctionnement
Section intitulée « Fonctionnement »- Avant de transmettre une requete, Claudex estime le nombre total de tokens
- Si les tokens depassent
threshold_tokens, les messages plus anciens (au-dela dekeep_recent) sont remplaces par un resume - Le resume est genere par le LLM local configure
- La conversation compressee est ensuite transmise au fournisseur
Partage inter-profils
Section intitulée « Partage inter-profils »Partagez le contexte entre differents profils de fournisseurs au sein de la meme session.
[context.sharing]enabled = truemax_context_size = 2000 # nombre maximum de tokens a injecter depuis d'autres profilsUtile lorsque vous changez de fournisseur en cours de tache : le contexte pertinent des interactions precedentes est automatiquement inclus.
RAG local
Section intitulée « RAG local »Indexez le code et la documentation locaux pour la generation augmentee par recuperation. Les extraits de code pertinents sont automatiquement injectes dans les requetes.
[context.rag]enabled = trueindex_paths = ["./src", "./docs"] # repertoires a indexerprofile = "openrouter" # reutiliser le base_url + api_key d'un profilmodel = "openai/text-embedding-3-small" # modele d'embeddingchunk_size = 512 # taille des chunks de textetop_k = 5 # nombre de resultats a injecterFonctionnement
Section intitulée « Fonctionnement »- Au demarrage, Claudex indexe les fichiers dans
index_pathsen utilisant le modele d’embedding - Pour chaque requete, le message de l’utilisateur est transforme en embedding et compare a l’index
- Les top-k chunks les plus pertinents sont injectes comme contexte supplementaire dans la requete
- Le fournisseur recoit un contexte plus riche sur votre base de code