Routing intelligente
Il routing intelligente seleziona automaticamente il fornitore migliore per ogni richiesta in base alla classificazione degli intenti. Usa claudex run auto per attivarlo.
Come funziona
Sezione intitolata “Come funziona”- L’utente esegue
claudex run auto - Claude Code invia una richiesta al proxy
- Il proxy estrae il messaggio dell’utente e lo invia a un classificatore locale (ad es. Ollama)
- Il classificatore restituisce una categoria di intento (code, analysis, creative, search, math)
- Le regole di routing mappano l’intento al profilo fornitore ottimale
- La richiesta viene inoltrata al fornitore selezionato
Configurazione
Sezione intitolata “Configurazione”[router]enabled = trueprofile = "local-qwen" # riutilizza base_url + api_key di un profilo per la classificazionemodel = "qwen2.5:3b" # override modello (opzionale, predefinito: default_model del profilo)
[router.rules]code = "deepseek" # attivita di codice → DeepSeekanalysis = "grok" # attivita analitiche → Grokcreative = "chatgpt" # scrittura creativa → ChatGPTsearch = "kimi" # ricerca/consultazione → Kimimath = "deepseek" # matematica/logica → DeepSeekdefault = "grok" # fallback per intento non classificatoCategorie di intento
Sezione intitolata “Categorie di intento”| Intento | Descrizione | Esempi di attivita |
|---|---|---|
code | Programmazione e generazione di codice | Scrivere una funzione, correggere un bug, refactoring del codice |
analysis | Analisi dei dati e ragionamento | Analizzare log, confrontare approcci, spiegare concetti |
creative | Scrittura creativa e ideazione | Scrivere documentazione, proporre nomi, bozze di email |
search | Recupero di informazioni | Trovare documentazione API, cercare codici di errore |
math | Attivita matematiche e logiche | Calcolare complessita, dimostrare correttezza |
Utilizzo
Sezione intitolata “Utilizzo”# Esegui con routing intelligenteclaudex run auto
# Sovrascrivi il modello anche con auto-routingclaudex run auto -m grok-3-mini-beta