スマートルーティング
スマートルーティングはインテント分類に基づいて各リクエストに最適なプロバイダーを自動的に選択します。claudex run auto で有効化できます。
動作の仕組み
Section titled “動作の仕組み”- ユーザーが
claudex run autoを実行 - Claude Code がプロキシにリクエストを送信
- プロキシがユーザーのメッセージを抽出し、ローカル分類器(例: Ollama)に送信
- 分類器がインテントカテゴリ(code、analysis、creative、search、math)を返す
- ルーティングルールがインテントを最適なプロバイダープロファイルにマッピング
- リクエストが選択されたプロバイダーに転送される
[router]enabled = trueprofile = "local-qwen" # 分類に使用するプロファイルの base_url + api_key を再利用model = "qwen2.5:3b" # モデルを上書き(任意、デフォルトはプロファイルの default_model)
[router.rules]code = "deepseek" # コーディングタスク → DeepSeekanalysis = "grok" # 分析タスク → Grokcreative = "chatgpt" # クリエイティブライティング → ChatGPTsearch = "kimi" # 検索/リサーチ → Kimimath = "deepseek" # 数学/論理 → DeepSeekdefault = "grok" # 未分類のフォールバックインテントカテゴリ
Section titled “インテントカテゴリ”| インテント | 説明 | タスク例 |
|---|---|---|
code | プログラミングとコード生成 | 関数の作成、バグ修正、リファクタリング |
analysis | データ分析と推論 | ログ分析、アプローチの比較、概念の説明 |
creative | クリエイティブライティングとアイデア出し | ドキュメント作成、名前のブレインストーミング、メール下書き |
search | 情報検索 | API ドキュメントの検索、エラーコードの調査 |
math | 数学的・論理的タスク | 計算量の算出、正確性の証明 |
# スマートルーティングで実行claudex run auto
# 自動ルーティングを使いつつモデルを上書きclaudex run auto -m grok-3-mini-beta