Saltearse al contenido

Cómo funciona

Semantara no cambia lo que tu aplicación pide; cambia cómo se resuelve para que cueste menos. Cada petición pasa por tres mecanismos.

Caché semántico

Antes de llamar al proveedor, Semantara busca si ya respondió algo semánticamente equivalente (no idéntico carácter por carácter, sino con el mismo significado). Si lo encuentra, sirve esa respuesta sin cobrarte una nueva llamada al proveedor.

El alcance del caché se configura por API key, y determina qué tan compartida es una respuesta:

  • Deshabilitado — no se cachea nada para esa key.
  • Público — respuestas comunes se comparten entre clientes (máximo ahorro para preguntas genéricas).
  • Privado por cliente — el caché es tuyo, compartido entre todas tus keys.
  • Privado por key — el caché queda aislado a esa key específica.

Los planes de nivel superior desbloquean alcances más privados. El aislamiento entre clientes está garantizado: una respuesta privada nunca se filtra a otro cliente.

Enrutamiento por complejidad

Con model: "proxy/auto", Semantara clasifica cada petición como simple, media o compleja, y la envía al modelo más económico de tu proveedor que la resuelve bien. Una pregunta trivial no paga el precio de un modelo de frontera; una compleja sí recibe la potencia que necesita.

Si prefieres control total, especifica el modelo a mano y Semantara lo respeta.

Tus claves, con respaldo (BYOK + failover)

Usas tus propias claves de proveedor (BYOK), cifradas en reposo. Puedes asignar a cada API key un proveedor principal y uno de respaldo: si el principal falla, Semantara reintenta con el respaldo automáticamente, sin que tu aplicación se entere.

Qué mides

Cada respuesta registra su costo real y el costo que habrías pagado sin Semantara. La diferencia es tu ahorro, visible en la Consola por día y por key. La métrica que importa: cuánto ahorras al mes.