Uebersetzungsproxy

Der Uebersetzungsproxy ist das Herzstueck von Claudex. Er sitzt zwischen Claude Code und Ihren KI-Anbietern und konvertiert transparent zwischen der Anthropic Messages API und der OpenAI Chat Completions API (oder Responses API).

Funktionsweise

Claude Code → Anthropic Messages API request
    │
    └── Claudex Proxy (127.0.0.1:13456)
        │
        ├── DirectAnthropic provider → forward with headers
        │
        ├── OpenAICompatible provider
        │   ├── Translate request: Anthropic → OpenAI Chat Completions
        │   ├── Apply query_params, strip_params, custom_headers
        │   ├── Forward to provider
        │   └── Translate response: OpenAI → Anthropic
        │
        └── OpenAIResponses provider
            ├── Translate request: Anthropic → OpenAI Responses API
            ├── Forward to provider
            └── Translate response: Responses → Anthropic

Provider-Adapter

Claudex verwendet ein ProviderAdapter-Trait, um Unterschiede zwischen den Provider-APIs zu behandeln. Drei Adapter sind implementiert:

Adapter	Uebersetzung	Verwendet von
DirectAnthropic	Keine (Durchleitung)	Anthropic, MiniMax, Vertex AI
ChatCompletions	Vollstaendige Anthropic-OpenAI-Uebersetzung	Grok, OpenAI, DeepSeek, Kimi, GLM, OpenRouter, Groq, Mistral, Together AI, Perplexity, Cerebras, Azure OpenAI, GitHub Copilot, GitLab Duo, Ollama, vLLM, LM Studio
Responses	Anthropic-OpenAI Responses API	ChatGPT/Codex-Abonnements

Was uebersetzt wird

Anfrageuebersetzung (Anthropic → OpenAI)

Anthropic	OpenAI
`system`-Feld	System-Nachricht im `messages`-Array
`messages[].content`-Bloecke (text, image, tool_use, tool_result)	`messages[].content` + `tool_calls`
`tools`-Array (JSON Schema mit `input_schema`)	`tools`-Array (Funktionsformat mit `parameters`)
`tool_choice` (`auto`, `any`, `{name}`)	`tool_choice` (`auto`, `required`, `{function: {name}}`)
`max_tokens`	`max_tokens` (begrenzt durch `max_tokens`-Profileinstellung, falls gesetzt)
`temperature`, `top_p`	Direkte Zuordnung (entfernt wenn `strip_params` zutrifft)

Antwortuebersetzung (OpenAI → Anthropic)

OpenAI	Anthropic
`choices[0].message.content`	`content`-Bloecke (type: text)
`choices[0].message.tool_calls`	`content`-Bloecke (type: tool_use)
`finish_reason: stop`	`stop_reason: end_turn`
`finish_reason: tool_calls`	`stop_reason: tool_use`
`usage.prompt_tokens` / `completion_tokens`	`usage.input_tokens` / `output_tokens`

Werkzeugname-Kompatibilitaet

Claude Code kann Werkzeugnamen generieren, die laenger als 64 Zeichen sind (z.B. mcp__server-name__very-long-tool-name-that-exceeds-the-limit). OpenAI und viele Anbieter erzwingen ein 64-Zeichen-Limit.

Claudex fuehrt automatisch folgende Schritte durch:

Namen, die 64 Zeichen ueberschreiten, in ausgehenden Anfragen kuerzen
Eine Zuordnungstabelle von gekuerzten zu originalen Namen erstellen
Originale Namen in Provider-Antworten wiederherstellen

Dieser Roundtrip ist vollstaendig transparent.

Streaming-Uebersetzung

Claudex unterstuetzt vollstaendig SSE (Server-Sent Events) Streaming und uebersetzt OpenAI-Stream-Chunks in Echtzeit in Anthropic-Stream-Events:

OpenAI SSE	Anthropic SSE
Erster Chunk	`message_start` + `content_block_start`
`choices[0].delta.content`	`content_block_delta` (text_delta)
`choices[0].delta.tool_calls`	`content_block_delta` (input_json_delta)
`finish_reason` vorhanden	`content_block_stop` + `message_delta` + `message_stop`

Der Streaming-Uebersetzer pflegt eine Zustandsmaschine zur korrekten Behandlung der Tool-Call-Akkumulation und der Inhaltsblock-Grenzen.

Azure OpenAI-Unterstuetzung

Azure OpenAI verwendet ein anderes Authentifizierungs- und URL-Schema:

Authentifizierung: api-key-Header anstelle von Authorization: Bearer
URL-Format: https://{resource}.openai.azure.com/openai/deployments/{deployment}
API-Version: Erforderlich ueber query_params

Claudex erkennt Azure automatisch, indem es prueft, ob base_url den String openai.azure.com enthaelt, und passt die Authentifizierung entsprechend an.

Unterstuetzte Anbieter

Anbieter	Typ	Basis-URL
Anthropic	DirectAnthropic	`https://api.anthropic.com`
MiniMax	DirectAnthropic	`https://api.minimax.io/anthropic`
Google Vertex AI	DirectAnthropic	`https://REGION-aiplatform.googleapis.com/v1/projects/...`
OpenRouter	OpenAICompatible	`https://openrouter.ai/api/v1`
Grok (xAI)	OpenAICompatible	`https://api.x.ai/v1`
OpenAI	OpenAICompatible	`https://api.openai.com/v1`
DeepSeek	OpenAICompatible	`https://api.deepseek.com`
Kimi/Moonshot	OpenAICompatible	`https://api.moonshot.ai/v1`
GLM (Zhipu)	OpenAICompatible	`https://api.z.ai/api/paas/v4`
Groq	OpenAICompatible	`https://api.groq.com/openai/v1`
Mistral AI	OpenAICompatible	`https://api.mistral.ai/v1`
Together AI	OpenAICompatible	`https://api.together.xyz/v1`
Perplexity	OpenAICompatible	`https://api.perplexity.ai`
Cerebras	OpenAICompatible	`https://api.cerebras.ai/v1`
Azure OpenAI	OpenAICompatible	`https://{resource}.openai.azure.com/...`
GitHub Copilot	OpenAICompatible	`https://api.githubcopilot.com`
GitLab Duo	OpenAICompatible	`https://gitlab.com/api/v4/ai/llm/proxy`
Ollama	OpenAICompatible	`http://localhost:11434/v1`
vLLM	OpenAICompatible	`http://localhost:8000/v1`
LM Studio	OpenAICompatible	`http://localhost:1234/v1`
ChatGPT/Codex-Abo	OpenAIResponses	`https://chatgpt.com/backend-api/codex`

Models-Endpunkt

Der Proxy stellt einen /v1/models-Endpunkt bereit, der alle aktivierten Profile auflistet. Jeder Eintrag enthaelt benutzerdefinierte Felder:

x-claudex-profile: Profilname
x-claudex-provider: Anbietertyp (anthropic, openai-compatible, openai-responses)

Claude Code fragt diesen Endpunkt ab, um verfuegbare Modelle zu ermitteln.

Proxy-Verwaltung

# Proxy als Daemon starten
claudex proxy start -d

# Proxy-Status pruefen
claudex proxy status

# Proxy-Daemon stoppen
claudex proxy stop

# Auf einem benutzerdefinierten Port starten
claudex proxy start -p 8080

Beim Ausfuehren von claudex run <profile> wird der Proxy automatisch im Hintergrund gestartet, falls noch nicht aktiv.