Gabriel Neuman
Gabriel Neuman
ModelosGoogle AI·20 de abril de 2026

Gemini API estrena Flex y Priority: cuándo usar cada uno

Google añadió dos tiers al Gemini API para balancear costo y velocidad. Guía práctica para PyMEs que ya automatizan con IA.

Qué pasó

Google lanzó dos nuevos tiers de inferencia para el Gemini API: Flex y Priority. Flex baja el costo a cambio de mayor latencia y menos garantías de disponibilidad. Priority ofrece respuestas más rápidas y estables, a un precio mayor que el tier estándar.

Por qué importa para PyMEs LATAM

La mayoría de las PyMEs que ya usan IA no miden su gasto por token hasta que la factura sorprende. Tener tres velocidades (Flex, Standard, Priority) permite decidir proceso por proceso en lugar de pagar lo mismo por todo. Eso se traduce en cuentas más predecibles al automatizar tareas con modelos de Google.

La lectura

La señal real aquí no es un modelo nuevo ni más inteligencia; es granularidad de precio. Lo interesante es que obliga a clasificar procesos por urgencia, algo que casi nadie hace. El trade-off es claro: Flex sirve para trabajo en lote que puede esperar minutos u horas, Priority para cualquier cosa donde un cliente humano esté esperando del otro lado. El hype sería creer que Priority "hace mejor" el trabajo; no, solo responde más rápido y con más estabilidad.

Piensa en una agencia de 15 personas que cada noche procesa 2,000 correos de clientes para clasificarlos y resumirlos. Ese flujo puede correr en Flex y ahorrar bastante. Pero el chatbot de su sitio, donde un prospecto espera respuesta en segundos, necesita Priority o estándar. Mismo modelo, distinto tier, factura muy diferente a fin de mes.

Qué hacer a partir de hoy

  • Lista tus automatizaciones actuales con IA y marca cada una como "tiempo real", "minutos" u "horas/nocturno".
  • Mueve a Flex todo lo que sea batch: reportes, enriquecimiento de bases, clasificación masiva, resúmenes nocturnos.
  • Deja en Priority solo lo que afecte experiencia directa de cliente: chat en vivo, respuestas en WhatsApp, call center asistido.
  • Revisa la factura del último mes de Gemini (o del proveedor que uses) y calcula cuánto ahorrarías moviendo el 30% más pesado a Flex.
  • Documenta la decisión por proceso en una hoja simple. Cuando un flujo crezca 10x, ya tendrás criterio para reubicarlo sin rehacer todo.

¿TE SIRVIÓ?

Recibe la edición semanal
en tu correo.