Saltearse al contenido

Compatibilidad de proveedores

ProveedorTipoAutenticacionStreamingUso de herramientasSlots de modeloNotas
AnthropicDirectAnthropicClave APISiSiSiNativo, sin traduccion
MiniMaxDirectAnthropicClave APISiSiSiProxy compatible con Anthropic
Google Vertex AIDirectAnthropicAccess TokenSiSiSigcloud auth print-access-token
OpenRouterOpenAICompatibleClave APISiSiSiMas de 200 modelos via una sola API
Grok (xAI)OpenAICompatibleClave APISiSiSi
OpenAIOpenAICompatibleClave APISiSiSi
DeepSeekOpenAICompatibleClave APISiSiSi
Kimi / MoonshotOpenAICompatibleClave API / OAuthSiSiSi
GLM (Zhipu)OpenAICompatibleClave APISiSiSi
GroqOpenAICompatibleClave APISiSiSiInferencia ultra-rapida
Mistral AIOpenAICompatibleClave APISiSiSi
Together AIOpenAICompatibleClave APISiSiSi
PerplexityOpenAICompatibleClave APISiLimitadoSiBusqueda web integrada
CerebrasOpenAICompatibleClave APISiSiSiInferencia rapida
Azure OpenAIOpenAICompatibleClave APISiSiSiCabecera api-key + query_params
GitHub CopilotOpenAICompatibleOAuthSiSiSiFlujo Device Code
GitLab DuoOpenAICompatibleOAuth (PAT)SiSiSiVariable de entorno GITLAB_TOKEN
ChatGPT/CodexOpenAIResponsesOAuthSiSiSiAPI de Responses
Claude (sub)DirectAnthropicOAuthSiSiSiOmite el proxy
Google Gemini (sub)OpenAICompatibleOAuthSiSiSiCredenciales de Gemini CLI
Qwen (sub)OpenAICompatibleOAuthSiSiSiFlujo Device Code
OllamaOpenAICompatibleNingunaSiDepende del modeloSiLocal, sin clave API
vLLMOpenAICompatibleNingunaSiDepende del modeloSiLocal
LM StudioOpenAICompatibleNingunaSiDepende del modeloSiLocal
Bedrock (LiteLLM)OpenAICompatibleClave APISiSiSiVia proxy LiteLLM
  • URL base: https://api.anthropic.com
  • Tipo: DirectAnthropic (sin traduccion necesaria)
  • Autenticacion: Clave API (sk-ant-*)
  • Modelos: claude-opus-4, claude-sonnet-4, claude-haiku-4
  • Obtener clave API: console.anthropic.com
  • URL base: https://api.minimax.io/anthropic
  • Tipo: DirectAnthropic (sin traduccion necesaria)
  • Autenticacion: Clave API
  • Modelos: Usa nombres de modelos Anthropic (proxy)
  • Obtener clave API: platform.minimaxi.com
  • URL base: https://REGION-aiplatform.googleapis.com/v1/projects/PROJECT/locations/REGION/publishers/anthropic/models
  • Tipo: DirectAnthropic
  • Autenticacion: GCP Access Token (gcloud auth print-access-token)
  • Modelos: claude-sonnet-4@20250514, claude-opus-4@20250514
  • Configuracion: Vertex AI Console
  • URL base: https://openrouter.ai/api/v1
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API (sk-or-*)
  • Modelos: Mas de 200 modelos de multiples proveedores
  • Obtener clave API: openrouter.ai/keys
  • URL base: https://api.x.ai/v1
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API (xai-*)
  • Modelos: grok-3-beta, grok-3-mini-beta
  • Obtener clave API: console.x.ai
  • URL base: https://api.openai.com/v1
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API (sk-*)
  • Modelos: gpt-4o, gpt-4o-mini, o1, o1-mini
  • Obtener clave API: platform.openai.com/api-keys
  • URL base: https://api.deepseek.com
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API
  • Modelos: deepseek-chat, deepseek-reasoner
  • Obtener clave API: platform.deepseek.com
  • URL base: https://api.moonshot.ai/v1
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API / OAuth
  • Modelos: kimi-k2-0905-preview, moonshot-v1-128k
  • Obtener clave API: platform.moonshot.cn
  • URL base: https://api.z.ai/api/paas/v4
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API
  • Modelos: glm-4.6, glm-4-plus
  • Obtener clave API: open.bigmodel.cn
  • URL base: https://api.groq.com/openai/v1
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API (gsk_*)
  • Modelos: llama-3.3-70b-versatile, mixtral-8x7b-32768, gemma2-9b-it
  • Obtener clave API: console.groq.com
  • Nota: Inferencia extremadamente rapida para modelos open-source
  • URL base: https://api.mistral.ai/v1
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API
  • Modelos: mistral-large-latest, mistral-small-latest
  • Obtener clave API: console.mistral.ai
  • URL base: https://api.together.xyz/v1
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API
  • Modelos: meta-llama/Llama-3.3-70B-Instruct-Turbo, y muchos modelos open-source
  • Obtener clave API: api.together.ai
  • URL base: https://api.perplexity.ai
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API (pplx-*)
  • Modelos: sonar-pro, sonar
  • Obtener clave API: perplexity.ai/settings/api
  • Nota: Los modelos incluyen capacidades de busqueda web integradas
  • URL base: https://api.cerebras.ai/v1
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API
  • Modelos: llama-3.3-70b
  • Obtener clave API: cloud.cerebras.ai
  • Nota: Plataforma de inferencia rapida
  • URL base: https://YOUR_RESOURCE.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API (via cabecera api-key, auto-detectado)
  • Modelos: Depende del despliegue (gpt-4o, gpt-4, etc.)
  • Configuracion: Azure Portal
  • Nota: Requiere api-version en query_params
  • URL base: https://api.githubcopilot.com
  • Tipo: OpenAICompatible
  • Autenticacion: OAuth (flujo Device Code)
  • Modelos: gpt-4o (por defecto)
  • Nota: Requiere suscripcion activa de GitHub Copilot
  • URL base: https://gitlab.com/api/v4/ai/llm/proxy (o autogestionado)
  • Tipo: OpenAICompatible
  • Autenticacion: OAuth (Personal Access Token via GITLAB_TOKEN)
  • Modelos: claude-sonnet-4-20250514
  • Nota: Soporta --enterprise-url para instancias autogestionadas
  • URL base: https://chatgpt.com/backend-api/codex
  • Tipo: OpenAIResponses
  • Autenticacion: OAuth (PKCE en navegador / Device Code)
  • Modelos: gpt-5.3-codex, gpt-5.1-codex, codex-mini-latest
  • Nota: Usa la API de Responses, no Chat Completions. strip_params = "auto" elimina parametros no soportados.
  • URL base: https://api.claude.ai
  • Tipo: DirectAnthropic
  • Autenticacion: OAuth (lee ~/.claude/.credentials.json)
  • Modelos: claude-sonnet-4, claude-opus-4, claude-haiku-4
  • Nota: El proxy se omite. Claude Code usa su propio OAuth directamente.
  • URL base: https://generativelanguage.googleapis.com/v1beta/openai
  • Tipo: OpenAICompatible
  • Autenticacion: OAuth (credenciales de Gemini CLI)
  • Modelos: gemini-2.5-pro, gemini-2.0-flash
  • URL base: https://chat.qwen.ai/api
  • Tipo: OpenAICompatible
  • Autenticacion: OAuth (flujo Device Code)
  • Modelos: qwen3-235b-a22b, qwen-max
  • URL base: http://localhost:11434/v1
  • Tipo: OpenAICompatible
  • Autenticacion: No requerida
  • Modelos: Cualquier modelo descargado (qwen2.5, llama3.3, etc.)
  • Configuracion: ollama.com
  • URL base: http://localhost:8000/v1
  • Tipo: OpenAICompatible
  • Autenticacion: No requerida
  • Modelos: Depende del modelo servido
  • URL base: http://localhost:1234/v1
  • Tipo: OpenAICompatible
  • Autenticacion: Ninguna / "lm-studio"
  • Modelos: Depende del modelo cargado
  • Configuracion: lmstudio.ai
  • URL base: http://localhost:4000/v1 (proxy LiteLLM)
  • Tipo: OpenAICompatible
  • Autenticacion: Clave API (clave LiteLLM)
  • Modelos: bedrock/anthropic.claude-sonnet-4-20250514-v2:0
  • Configuracion: docs.litellm.ai/docs/providers/bedrock