Google lanza Gemini 3.5 Live Translate para traducción de voz en tiempo real

Google presentó Gemini 3.5 Live Translate, un nuevo modelo capaz de traducir voz a voz en tiempo casi real en más de 70 idiomas. La herramienta detecta automáticamente el idioma del hablante y genera una voz traducida que mantiene entonación, ritmo y tono, incluso en entornos ruidosos.

A diferencia de los sistemas tradicionales, Live Translate no espera a que la persona termine de hablar: procesa el audio mientras se transmite y responde con apenas unos segundos de retraso. También admite entradas multilingües sin configuración previa.

El modelo comienza a desplegarse desde hoy en productos de Google, incluyendo una vista previa pública para desarrolladores en la API de Gemini Live y Google AI Studio, además de integrarse en Google Meet, Google Translate para Android e iOS y plataformas como Agora, Fishjam, LiveKit, Pipecat y Vision Agents.

Empresas como Grab ya están probando la tecnología para mejorar la comunicación entre conductores y pasajeros, quienes realizan más de 10 millones de llamadas mensuales. Google Meet, por su parte, ampliará su capacidad de traducción a más de 70 idiomas, permitiendo más de 2.000 combinaciones en una misma reunión. Todo el audio generado incluye una marca de agua SynthID para evitar desinformación.

Fuente: Cubadebate.cu

Publicaciones Similares

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *