Zum Inhalt springen

Konfigurationsreferenz

Claudex verwendet geschichtete Konfiguration ueber figment. Quellen werden in dieser Reihenfolge zusammengefuehrt (spaetere ueberschreiben fruehere):

  1. Programmatische Standardwerte
  2. Globale Konfiguration (~/.config/claudex/config.toml oder .yaml)
  3. Projektkonfiguration (claudex.toml/.claudex/config.toml im CWD oder uebergeordneten Verzeichnissen, oder $CLAUDEX_CONFIG)
  4. Umgebungsvariablen (CLAUDEX_-Praefix, __-Trennzeichen)

Sowohl TOML- als auch YAML-Formate werden unterstuetzt.

Siehe Konfiguration fuer Einrichtungsdetails.

# Pfad zur claude-Binaerdatei (Standard: "claude" aus PATH)
claude_binary = "claude"
# Proxy-Server-Bind-Port
proxy_port = 13456
# Proxy-Server-Bind-Adresse
proxy_host = "127.0.0.1"
# Log-Level: trace, debug, info, warn, error
log_level = "info"
# Terminal-Hyperlinks (OSC 8): "auto" | true | false
hyperlinks = "auto"
FeldTypStandardBeschreibung
claude_binarystring"claude"Pfad zur Claude Code CLI-Binaerdatei
proxy_portinteger13456Port, auf dem der Uebersetzungsproxy lauscht
proxy_hoststring"127.0.0.1"Adresse, an die der Proxy gebunden ist
log_levelstring"info"Minimaler Log-Level
hyperlinksstring/bool"auto"Terminal-Hyperlinks: "auto" (erkennen), true (erzwingen ein), false (erzwingen aus)

Kurzformen fuer Modellbezeichner definieren:

[model_aliases]
grok3 = "grok-3-beta"
gpt4o = "gpt-4o"
ds3 = "deepseek-chat"
claude = "claude-sonnet-4-20250514"

Aliase mit -m verwenden:

Terminal-Fenster
claudex run grok -m grok3
[[profiles]]
name = "grok"
provider_type = "OpenAICompatible"
base_url = "https://api.x.ai/v1"
api_key = "xai-..."
# api_key_keyring = "grok-api-key"
default_model = "grok-3-beta"
auth_type = "api-key" # "api-key" (Standard) oder "oauth"
# oauth_provider = "openai" # erforderlich wenn auth_type = "oauth"
backup_providers = ["deepseek"]
custom_headers = {}
extra_env = {}
priority = 100
enabled = true
max_tokens = 16384 # optional: Ausgabe-Token begrenzen
strip_params = "auto" # "auto" | "none" | ["temperature", "top_p"]
# URL-Abfrageparameter (z.B. Azure api-version)
[profiles.query_params]
# api-version = "2024-12-01-preview"
# Modell-Slot-Zuordnung (optional)
[profiles.models]
haiku = "grok-3-mini-beta"
sonnet = "grok-3-beta"
opus = "grok-3-beta"
FeldTypStandardBeschreibung
namestringerforderlichEindeutiger Profilbezeichner
provider_typestring"DirectAnthropic""DirectAnthropic", "OpenAICompatible" oder "OpenAIResponses"
base_urlstringerforderlichAPI-Endpunkt-URL des Anbieters
api_keystring""API-Schluessel im Klartext
api_key_keyringstringName des OS-Schluesselbundeintrags (ueberschreibt api_key)
default_modelstringerforderlichStandardmaessig verwendeter Modellbezeichner
auth_typestring"api-key"Authentifizierungsmethode: "api-key" oder "oauth"
oauth_providerstringOAuth-Anbietername. Eines von: claude, openai, google, qwen, kimi, github, gitlab
backup_providersstring[][]Profilnamen fuer Failover, in Reihenfolge versucht
custom_headersmap{}Zusaetzliche HTTP-Header, die mit jeder Anfrage gesendet werden
extra_envmap{}Umgebungsvariablen, die beim Starten von Claude gesetzt werden
priorityinteger100Prioritaetsgewicht fuer intelligentes Routing (hoeher = bevorzugt)
enabledbooleantrueOb dieses Profil aktiv ist
max_tokensintegerMaximale Ausgabe-Token begrenzen. Wenn gesetzt, ueberschreibt max_tokens in Anfragen
strip_paramsstring/array"auto"Parameter, die aus Anfragen entfernt werden. "auto" erkennt bekannte Endpunkte; "none" sendet alle; Array entfernt bestimmte Parameter
[profiles.query_params]
api-version = "2024-12-01-preview"
FeldTypBeschreibung
query_paramsmapSchluessel-Wert-Paare, die als URL-Abfrageparameter an jede Anfrage angehaengt werden

Wird hauptsaechlich fuer Azure OpenAI (api-version) verwendet, funktioniert aber mit jedem Anbieter.

Die optionale [profiles.models]-Tabelle ordnet die /model-Umschalter-Slots von Claude Code anbieterspezifischen Modellnamen zu. Beim Wechseln von Modellen in Claude Code (z.B. /model opus) uebersetzt Claudex die Anfrage zum zugeordneten Modell.

[profiles.models]
haiku = "grok-3-mini-beta" # ordnet /model haiku zu
sonnet = "grok-3-beta" # ordnet /model sonnet zu
opus = "grok-3-beta" # ordnet /model opus zu
FeldTypBeschreibung
haikustringZu verwendendes Modell, wenn Claude Code haiku auswaehlt
sonnetstringZu verwendendes Modell, wenn Claude Code sonnet auswaehlt
opusstringZu verwendendes Modell, wenn Claude Code opus auswaehlt
# Anthropic (DirectAnthropic -- keine Uebersetzung)
[[profiles]]
name = "anthropic"
provider_type = "DirectAnthropic"
base_url = "https://api.anthropic.com"
api_key = "sk-ant-..."
default_model = "claude-sonnet-4-20250514"
# MiniMax (DirectAnthropic -- keine Uebersetzung)
[[profiles]]
name = "minimax"
provider_type = "DirectAnthropic"
base_url = "https://api.minimax.io/anthropic"
api_key = "..."
default_model = "claude-sonnet-4-20250514"
backup_providers = ["anthropic"]
# OpenRouter (OpenAICompatible -- Uebersetzung erforderlich)
[[profiles]]
name = "openrouter"
provider_type = "OpenAICompatible"
base_url = "https://openrouter.ai/api/v1"
api_key = "..."
default_model = "anthropic/claude-sonnet-4"
# Grok (OpenAICompatible -- Uebersetzung erforderlich)
[[profiles]]
name = "grok"
provider_type = "OpenAICompatible"
base_url = "https://api.x.ai/v1"
api_key = "xai-..."
default_model = "grok-3-beta"
backup_providers = ["deepseek"]
# OpenAI (OpenAICompatible -- Uebersetzung erforderlich)
[[profiles]]
name = "chatgpt"
provider_type = "OpenAICompatible"
base_url = "https://api.openai.com/v1"
api_key = "sk-..."
default_model = "gpt-4o"
# DeepSeek (OpenAICompatible -- Uebersetzung erforderlich)
[[profiles]]
name = "deepseek"
provider_type = "OpenAICompatible"
base_url = "https://api.deepseek.com"
api_key = "..."
default_model = "deepseek-chat"
backup_providers = ["grok"]
# Kimi / Moonshot (OpenAICompatible -- Uebersetzung erforderlich)
[[profiles]]
name = "kimi"
provider_type = "OpenAICompatible"
base_url = "https://api.moonshot.ai/v1"
api_key = "..."
default_model = "kimi-k2-0905-preview"
# GLM / Zhipu (OpenAICompatible -- Uebersetzung erforderlich)
[[profiles]]
name = "glm"
provider_type = "OpenAICompatible"
base_url = "https://api.z.ai/api/paas/v4"
api_key = "..."
default_model = "glm-4.6"
# Groq (OpenAICompatible -- schnelle Inferenz)
[[profiles]]
name = "groq"
provider_type = "OpenAICompatible"
base_url = "https://api.groq.com/openai/v1"
api_key = "gsk_..."
default_model = "llama-3.3-70b-versatile"
# Mistral AI (OpenAICompatible -- Uebersetzung erforderlich)
[[profiles]]
name = "mistral"
provider_type = "OpenAICompatible"
base_url = "https://api.mistral.ai/v1"
api_key = "..."
default_model = "mistral-large-latest"
# Together AI (OpenAICompatible -- Uebersetzung erforderlich)
[[profiles]]
name = "together"
provider_type = "OpenAICompatible"
base_url = "https://api.together.xyz/v1"
api_key = "..."
default_model = "meta-llama/Llama-3.3-70B-Instruct-Turbo"
# Perplexity (OpenAICompatible -- Online-Suche + LLM)
[[profiles]]
name = "perplexity"
provider_type = "OpenAICompatible"
base_url = "https://api.perplexity.ai"
api_key = "pplx-..."
default_model = "sonar-pro"
# Cerebras (OpenAICompatible -- schnelle Inferenz)
[[profiles]]
name = "cerebras"
provider_type = "OpenAICompatible"
base_url = "https://api.cerebras.ai/v1"
api_key = "..."
default_model = "llama-3.3-70b"
# Azure OpenAI (OpenAICompatible -- api-key-Header + query_params)
[[profiles]]
name = "azure-openai"
provider_type = "OpenAICompatible"
base_url = "https://YOUR_RESOURCE.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT"
api_key = "YOUR_AZURE_KEY"
default_model = "gpt-4o"
[profiles.query_params]
api-version = "2024-12-01-preview"
# Google Vertex AI (DirectAnthropic)
[[profiles]]
name = "vertex-ai"
provider_type = "DirectAnthropic"
base_url = "https://us-east5-aiplatform.googleapis.com/v1/projects/YOUR_PROJECT/locations/us-east5/publishers/anthropic/models"
api_key = "YOUR_GCLOUD_TOKEN"
default_model = "claude-sonnet-4@20250514"
# Ollama (lokal, kein API-Schluessel erforderlich)
[[profiles]]
name = "local-qwen"
provider_type = "OpenAICompatible"
base_url = "http://localhost:11434/v1"
api_key = ""
default_model = "qwen2.5:72b"
enabled = false
# vLLM / LM Studio (lokal)
[[profiles]]
name = "local-llama"
provider_type = "OpenAICompatible"
base_url = "http://localhost:8000/v1"
api_key = ""
default_model = "llama-3.3-70b"
enabled = false
# Claude Max (ueberspringt Proxy, verwendet natives OAuth von Claude aus ~/.claude)
[[profiles]]
name = "claude-max"
provider_type = "DirectAnthropic"
base_url = "https://api.claude.ai"
default_model = "claude-sonnet-4-20250514"
auth_type = "oauth"
oauth_provider = "claude"
[profiles.models]
haiku = "claude-haiku-4-20250514"
sonnet = "claude-sonnet-4-20250514"
opus = "claude-opus-4-20250514"
# ChatGPT/Codex-Abonnement (OpenAIResponses)
[[profiles]]
name = "codex-sub"
provider_type = "OpenAIResponses"
base_url = "https://chatgpt.com/backend-api/codex"
default_model = "gpt-5.3-codex"
auth_type = "oauth"
oauth_provider = "openai"
[profiles.models]
haiku = "codex-mini-latest"
sonnet = "gpt-5.3-codex"
opus = "gpt-5.3-codex"
# Google Gemini ueber OAuth
[[profiles]]
name = "gemini-sub"
provider_type = "OpenAICompatible"
base_url = "https://generativelanguage.googleapis.com/v1beta/openai"
default_model = "gemini-2.5-pro"
auth_type = "oauth"
oauth_provider = "google"
# Kimi ueber OAuth
[[profiles]]
name = "kimi-oauth"
provider_type = "OpenAICompatible"
base_url = "https://api.moonshot.cn/v1"
default_model = "moonshot-v1-128k"
auth_type = "oauth"
oauth_provider = "kimi"
# Qwen ueber OAuth
[[profiles]]
name = "qwen-oauth"
provider_type = "OpenAICompatible"
base_url = "https://chat.qwen.ai/api"
default_model = "qwen3-235b-a22b"
auth_type = "oauth"
oauth_provider = "qwen"
# GitHub Copilot ueber OAuth
[[profiles]]
name = "copilot"
provider_type = "OpenAICompatible"
base_url = "https://api.githubcopilot.com"
default_model = "gpt-4o"
auth_type = "oauth"
oauth_provider = "github"
# GitLab Duo ueber GITLAB_TOKEN
[[profiles]]
name = "gitlab-duo"
provider_type = "OpenAICompatible"
base_url = "https://gitlab.com/api/v4/ai/llm/proxy"
default_model = "claude-sonnet-4-20250514"
auth_type = "oauth"
oauth_provider = "gitlab"
[router]
enabled = false
profile = "local-qwen" # base_url + api_key eines Profils wiederverwenden
model = "qwen2.5:3b" # Modell ueberschreiben (optional)
FeldTypStandardBeschreibung
enabledbooleanfalseIntelligentes Routing aktivieren
profilestring""Profilname fuer Klassifikation (verwendet dessen base_url + api_key)
modelstring""Modellueberschreibung fuer Klassifikation (Standard ist default_model des Profils)
[router.rules]
code = "deepseek"
analysis = "grok"
creative = "chatgpt"
search = "kimi"
math = "deepseek"
default = "grok"
SchluesselBeschreibung
codeProfil fuer Programmieraufgaben
analysisProfil fuer Analyse und Schlussfolgern
creativeProfil fuer kreatives Schreiben
searchProfil fuer Suche und Recherche
mathProfil fuer Mathematik und Logik
defaultFallback, wenn Absicht nicht klassifiziert
[context.compression]
enabled = false
threshold_tokens = 50000
keep_recent = 10
profile = "local-qwen" # base_url + api_key eines Profils wiederverwenden
model = "qwen2.5:3b" # Modell ueberschreiben (optional)
FeldTypStandardBeschreibung
enabledbooleanfalseKonversationskomprimierung aktivieren
threshold_tokensinteger50000Komprimieren, wenn Token-Anzahl diesen Wert ueberschreitet
keep_recentinteger10Immer die letzten N Nachrichten unkomprimiert behalten
profilestring""Profilname fuer Zusammenfassung
modelstring""Modellueberschreibung fuer Zusammenfassung
[context.sharing]
enabled = false
max_context_size = 2000
FeldTypStandardBeschreibung
enabledbooleanfalseProfiluebergreifende Kontextfreigabe aktivieren
max_context_sizeinteger2000Maximale Token, die aus anderen Profilen injiziert werden
[context.rag]
enabled = false
index_paths = ["./src", "./docs"]
profile = "local-qwen" # base_url + api_key eines Profils wiederverwenden
model = "nomic-embed-text" # Einbettungsmodell
chunk_size = 512
top_k = 5
FeldTypStandardBeschreibung
enabledbooleanfalseLokales RAG aktivieren
index_pathsstring[][]Zu indizierende Verzeichnisse
profilestring""Profilname fuer Einbettungen
modelstring""Einbettungsmodellname
chunk_sizeinteger512Textchunk-Groesse in Token
top_kinteger5Anzahl der zu injizierenden Ergebnisse