Perguntas Frequentes do TrueFoundry AI Gateway

Question 1

O que é o TrueFoundry AI Gateway?

Accepted Answer

O TrueFoundry AI Gateway é uma camada de proxy que se situa entre as aplicações e os fornecedores de LLM/Servidores MCP. Ele fornece acesso unificado a mais de 250 LLMs (incluindo OpenAI, Claude, Gemini, Groq, Mistral) através de uma única API, centraliza a gestão de chaves de API, permite a observabilidade do uso de tokens e métricas de desempenho e impõe políticas de governança. Ele suporta tipos de modelos de chat, conclusão, incorporação e reclassificação, garantindo uma latência interna inferior a 3ms.

Question 2

Que opções de implementação estão disponíveis para o TrueFoundry AI Gateway?

Accepted Answer

O TrueFoundry AI Gateway pode ser implementado em vários ambientes: VPC, on-premises, ambientes air-gapped ou em várias clouds. A oferta SaaS é hospedada em várias regiões em todo o mundo para baixa latência e alta disponibilidade. As organizações também podem implementar o gateway on-premise ou em qualquer fornecedor de cloud na sua região, mais perto dos seus utilizadores, garantindo a soberania e conformidade dos dados.

Question 3

Que recursos de segurança e governança o TrueFoundry AI Gateway oferece?

Accepted Answer

O TrueFoundry AI Gateway oferece recursos abrangentes de segurança e governança, incluindo: OAuth2 e RBAC para controlo de acesso, limitação de taxa por utilizador/serviço/endpoint, quotas baseadas em custos e em tokens, gestão centralizada de chaves de API, registo de auditoria e conformidade com os padrões SOC 2, HIPAA e GDPR. Ele também suporta proteções de segurança personalizadas, incluindo filtragem de PII e deteção de toxicidade.

Question 4

Como é que o TrueFoundry AI Gateway lida com a fiabilidade e o desempenho?

Accepted Answer

O TrueFoundry AI Gateway atinge 99,99% de tempo de atividade através de recursos como o encaminhamento baseado na latência para o LLM disponível mais rápido, balanceamento de carga ponderado para distribuição de tráfego, fallback automático para modelos secundários durante falhas e encaminhamento com reconhecimento geográfico para conformidade regional. Ele mantém uma latência interna inferior a 3ms, mesmo sob cargas de trabalho de escala empresarial, e pode escalar perfeitamente para gerir tráfego de pico e cargas de trabalho de alto rendimento.

Question 5

Que recursos de monitorização e observabilidade o TrueFoundry AI Gateway oferece?

Accepted Answer

O gateway oferece recursos abrangentes de monitorização, incluindo: rastreamento do uso de tokens, monitorização da latência, rastreamento da taxa de erros, métricas de volume de pedidos, registos completos de pedidos/respostas para conformidade e depuração e a capacidade de etiquetar o tráfego com metadados como ID de utilizador, equipa ou ambiente. Os utilizadores podem filtrar registos e métricas por modelo, equipa ou geografia para identificar rapidamente problemas e acelerar a resolução.

TrueFoundry AI Gateway

Informações do Produto

O que é TrueFoundry AI Gateway

Principais Recursos do TrueFoundry AI Gateway

Casos de Uso do TrueFoundry AI Gateway

Vantagens

Desvantagens

Como Usar o TrueFoundry AI Gateway