Zum Inhalt springen

Anbieter-Kompatibilitaet

AnbieterTypAuthStreamingTool UseModell-SlotsHinweise
AnthropicDirectAnthropicAPI KeyJaJaJaNativ, keine Uebersetzung
MiniMaxDirectAnthropicAPI KeyJaJaJaAnthropic-kompatibler Proxy
Google Vertex AIDirectAnthropicAccess TokenJaJaJagcloud auth print-access-token
OpenRouterOpenAICompatibleAPI KeyJaJaJa200+ Modelle ueber eine API
Grok (xAI)OpenAICompatibleAPI KeyJaJaJa
OpenAIOpenAICompatibleAPI KeyJaJaJa
DeepSeekOpenAICompatibleAPI KeyJaJaJa
Kimi / MoonshotOpenAICompatibleAPI Key / OAuthJaJaJa
GLM (Zhipu)OpenAICompatibleAPI KeyJaJaJa
GroqOpenAICompatibleAPI KeyJaJaJaExtrem schnelle Inferenz
Mistral AIOpenAICompatibleAPI KeyJaJaJa
Together AIOpenAICompatibleAPI KeyJaJaJa
PerplexityOpenAICompatibleAPI KeyJaEingeschraenktJaEingebaute Websuche
CerebrasOpenAICompatibleAPI KeyJaJaJaSchnelle Inferenz
Azure OpenAIOpenAICompatibleAPI KeyJaJaJaapi-key-Header + query_params
GitHub CopilotOpenAICompatibleOAuthJaJaJaDevice Code Flow
GitLab DuoOpenAICompatibleOAuth (PAT)JaJaJaGITLAB_TOKEN-Umgebungsvariable
ChatGPT/CodexOpenAIResponsesOAuthJaJaJaResponses API
Claude (Abo)DirectAnthropicOAuthJaJaJaUeberspringt Proxy
Google Gemini (Abo)OpenAICompatibleOAuthJaJaJaGemini CLI-Anmeldedaten
Qwen (Abo)OpenAICompatibleOAuthJaJaJaDevice Code Flow
OllamaOpenAICompatibleKeineJaModellabhaengigJaLokal, kein API-Schluessel
vLLMOpenAICompatibleKeineJaModellabhaengigJaLokal
LM StudioOpenAICompatibleKeineJaModellabhaengigJaLokal
Bedrock (LiteLLM)OpenAICompatibleAPI KeyJaJaJaUeber LiteLLM-Proxy
  • Base URL: https://api.anthropic.com
  • Typ: DirectAnthropic (keine Uebersetzung erforderlich)
  • Auth: API Key (sk-ant-*)
  • Modelle: claude-opus-4, claude-sonnet-4, claude-haiku-4
  • API-Schluessel: console.anthropic.com
  • Base URL: https://api.minimax.io/anthropic
  • Typ: DirectAnthropic (keine Uebersetzung erforderlich)
  • Auth: API Key
  • Modelle: Verwendet Anthropic-Modellnamen (proxied)
  • API-Schluessel: platform.minimaxi.com
  • Base URL: https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/REGION/publishers/anthropic/models
  • Typ: DirectAnthropic
  • Auth: GCP Access Token (gcloud auth print-access-token)
  • Modelle: claude-sonnet-4@20250514, claude-opus-4@20250514
  • Einrichtung: Vertex AI Console
  • Base URL: https://openrouter.ai/api/v1
  • Typ: OpenAICompatible
  • Auth: API Key (sk-or-*)
  • Modelle: 200+ Modelle von verschiedenen Anbietern
  • API-Schluessel: openrouter.ai/keys
  • Base URL: https://api.x.ai/v1
  • Typ: OpenAICompatible
  • Auth: API Key (xai-*)
  • Modelle: grok-3-beta, grok-3-mini-beta
  • API-Schluessel: console.x.ai
  • Base URL: https://api.openai.com/v1
  • Typ: OpenAICompatible
  • Auth: API Key (sk-*)
  • Modelle: gpt-4o, gpt-4o-mini, o1, o1-mini
  • API-Schluessel: platform.openai.com/api-keys
  • Base URL: https://api.deepseek.com
  • Typ: OpenAICompatible
  • Auth: API Key
  • Modelle: deepseek-chat, deepseek-reasoner
  • API-Schluessel: platform.deepseek.com
  • Base URL: https://api.moonshot.ai/v1
  • Typ: OpenAICompatible
  • Auth: API Key / OAuth
  • Modelle: kimi-k2-0905-preview, moonshot-v1-128k
  • API-Schluessel: platform.moonshot.cn
  • Base URL: https://api.z.ai/api/paas/v4
  • Typ: OpenAICompatible
  • Auth: API Key
  • Modelle: glm-4.6, glm-4-plus
  • API-Schluessel: open.bigmodel.cn
  • Base URL: https://api.groq.com/openai/v1
  • Typ: OpenAICompatible
  • Auth: API Key (gsk_*)
  • Modelle: llama-3.3-70b-versatile, mixtral-8x7b-32768, gemma2-9b-it
  • API-Schluessel: console.groq.com
  • Hinweis: Extrem schnelle Inferenz fuer Open-Source-Modelle
  • Base URL: https://api.mistral.ai/v1
  • Typ: OpenAICompatible
  • Auth: API Key
  • Modelle: mistral-large-latest, mistral-small-latest
  • API-Schluessel: console.mistral.ai
  • Base URL: https://api.together.xyz/v1
  • Typ: OpenAICompatible
  • Auth: API Key
  • Modelle: meta-llama/Llama-3.3-70B-Instruct-Turbo und viele Open-Source-Modelle
  • API-Schluessel: api.together.ai
  • Base URL: https://api.perplexity.ai
  • Typ: OpenAICompatible
  • Auth: API Key (pplx-*)
  • Modelle: sonar-pro, sonar
  • API-Schluessel: perplexity.ai/settings/api
  • Hinweis: Modelle enthalten eingebaute Websuch-Funktionen
  • Base URL: https://api.cerebras.ai/v1
  • Typ: OpenAICompatible
  • Auth: API Key
  • Modelle: llama-3.3-70b
  • API-Schluessel: cloud.cerebras.ai
  • Hinweis: Schnelle Inferenz-Plattform
  • Base URL: https://YOUR_RESOURCE.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT
  • Typ: OpenAICompatible
  • Auth: API Key (ueber api-key-Header, automatisch erkannt)
  • Modelle: Abhaengig von der Bereitstellung (gpt-4o, gpt-4 usw.)
  • Einrichtung: Azure Portal
  • Hinweis: Erfordert api-version in query_params
  • Base URL: https://api.githubcopilot.com
  • Typ: OpenAICompatible
  • Auth: OAuth (Device Code Flow)
  • Modelle: gpt-4o (Standard)
  • Hinweis: Erfordert aktives GitHub Copilot-Abonnement
  • Base URL: https://gitlab.com/api/v4/ai/llm/proxy (oder selbst-gehostet)
  • Typ: OpenAICompatible
  • Auth: OAuth (Personal Access Token ueber GITLAB_TOKEN)
  • Modelle: claude-sonnet-4-20250514
  • Hinweis: Unterstuetzt --enterprise-url fuer selbst-gehostete Instanzen
  • Base URL: https://chatgpt.com/backend-api/codex
  • Typ: OpenAIResponses
  • Auth: OAuth (Browser-PKCE / Device Code)
  • Modelle: gpt-5.3-codex, gpt-5.1-codex, codex-mini-latest
  • Hinweis: Verwendet Responses API, keine Chat Completions. strip_params = "auto" entfernt nicht unterstuetzte Parameter.
  • Base URL: https://api.claude.ai
  • Typ: DirectAnthropic
  • Auth: OAuth (liest ~/.claude/.credentials.json)
  • Modelle: claude-sonnet-4, claude-opus-4, claude-haiku-4
  • Hinweis: Proxy wird uebersprungen. Claude Code verwendet sein eigenes OAuth direkt.
  • Base URL: https://generativelanguage.googleapis.com/v1beta/openai
  • Typ: OpenAICompatible
  • Auth: OAuth (Gemini CLI-Anmeldedaten)
  • Modelle: gemini-2.5-pro, gemini-2.0-flash
  • Base URL: https://chat.qwen.ai/api
  • Typ: OpenAICompatible
  • Auth: OAuth (Device Code Flow)
  • Modelle: qwen3-235b-a22b, qwen-max
  • Base URL: http://localhost:11434/v1
  • Typ: OpenAICompatible
  • Auth: Keine erforderlich
  • Modelle: Jedes heruntergeladene Modell (qwen2.5, llama3.3 usw.)
  • Einrichtung: ollama.com
  • Base URL: http://localhost:8000/v1
  • Typ: OpenAICompatible
  • Auth: Keine erforderlich
  • Modelle: Abhaengig vom bereitgestellten Modell
  • Base URL: http://localhost:1234/v1
  • Typ: OpenAICompatible
  • Auth: Keine / "lm-studio"
  • Modelle: Abhaengig vom geladenen Modell
  • Einrichtung: lmstudio.ai
  • Base URL: http://localhost:4000/v1 (LiteLLM-Proxy)
  • Typ: OpenAICompatible
  • Auth: API Key (LiteLLM-Schluessel)
  • Modelle: bedrock/anthropic.claude-sonnet-4-20250514-v2:0
  • Einrichtung: docs.litellm.ai/docs/providers/bedrock