Aller au contenu

Routage intelligent

Le routage intelligent selectionne automatiquement le meilleur fournisseur pour chaque requete en fonction de la classification de l’intention. Utilisez claudex run auto pour l’activer.

  1. L’utilisateur execute claudex run auto
  2. Claude Code envoie une requete au proxy
  3. Le proxy extrait le message de l’utilisateur et l’envoie a un classificateur local (par ex. Ollama)
  4. Le classificateur retourne une categorie d’intention (code, analysis, creative, search, math)
  5. Les regles de routage font correspondre l’intention au profil fournisseur optimal
  6. La requete est transmise au fournisseur selectionne
[router]
enabled = true
profile = "local-qwen" # reutiliser le base_url + api_key d'un profil pour la classification
model = "qwen2.5:3b" # remplacer le modele (optionnel, par defaut le default_model du profil)
[router.rules]
code = "deepseek" # taches de codage → DeepSeek
analysis = "grok" # taches analytiques → Grok
creative = "chatgpt" # ecriture creative → ChatGPT
search = "kimi" # recherche/documentation → Kimi
math = "deepseek" # math/logique → DeepSeek
default = "grok" # repli pour les intentions non classifiees
IntentionDescriptionExemples de taches
codeProgrammation et generation de codeEcrire une fonction, corriger un bug, refactoriser du code
analysisAnalyse de donnees et raisonnementAnalyser des logs, comparer des approches, expliquer des concepts
creativeEcriture creative et ideationRediger de la documentation, trouver des noms, rediger des emails
searchRecuperation d’informationsTrouver des docs API, rechercher des codes d’erreur
mathTaches mathematiques et logiquesCalculer la complexite, prouver la correction
Fenêtre de terminal
# Executer avec le routage intelligent
claudex run auto
# Remplacer le modele meme avec le routage automatique
claudex run auto -m grok-3-mini-beta