Motor de contexto
El motor de contexto mejora tus interacciones con IA a traves de tres mecanismos: compresion de conversaciones, comparticion de contexto entre perfiles y RAG local (Generacion Aumentada por Recuperacion).
Compresion de conversaciones
Sección titulada «Compresion de conversaciones»Cuando las conversaciones superan un umbral de tokens, Claudex usa un LLM para resumir los mensajes mas antiguos, manteniendo intactos los mas recientes.
[context.compression]enabled = truethreshold_tokens = 50000 # comprimir cuando el total de tokens supere estokeep_recent = 10 # mantener siempre los ultimos N mensajesprofile = "openrouter" # reutilizar la base_url + api_key de un perfilmodel = "qwen/qwen-2.5-7b-instruct" # sobreescribir modelo (opcional)Como funciona
Sección titulada «Como funciona»- Antes de reenviar una solicitud, Claudex estima el recuento total de tokens
- Si los tokens superan
threshold_tokens, los mensajes mas antiguos (mas alla dekeep_recent) se reemplazan por un resumen - El resumen es generado por el LLM local configurado
- La conversacion comprimida se reenvia al proveedor
Comparticion entre perfiles
Sección titulada «Comparticion entre perfiles»Comparte contexto entre diferentes perfiles de proveedores dentro de la misma sesion.
[context.sharing]enabled = truemax_context_size = 2000 # tokens maximos a inyectar desde otros perfilesEsto es util cuando se cambia entre proveedores a mitad de una tarea: el contexto relevante de interacciones anteriores se incluye automaticamente.
RAG local
Sección titulada «RAG local»Indexa codigo y documentacion local para generacion aumentada por recuperacion. Los fragmentos de codigo relevantes se inyectan automaticamente en las solicitudes.
[context.rag]enabled = trueindex_paths = ["./src", "./docs"] # directorios a indexarprofile = "openrouter" # reutilizar la base_url + api_key de un perfilmodel = "openai/text-embedding-3-small" # modelo de embeddingchunk_size = 512 # tamano del fragmento de textotop_k = 5 # numero de resultados a inyectarComo funciona
Sección titulada «Como funciona»- Al iniciarse, Claudex indexa los archivos en
index_pathsusando el modelo de embedding - Para cada solicitud, el mensaje del usuario se embebe y se compara con el indice
- Los top-k fragmentos mas relevantes se inyectan como contexto adicional en la solicitud
- El proveedor recibe contexto mas rico sobre tu base de codigo