Gabriel Neuman
Gabriel Neuman
OPENAI · REALTIME

Sample oficial de OpenAI que muestra cómo mover un Kanban en vivo con voz mientras hablan en una junta.

Cuando OpenAI publica un sample, pasan dos cosas: marca el patrón canónico de uso, y la comunidad lo copia. Este muestra Realtime API más WebRTC más function calling. Buen punto de partida para automatizar la captura de decisiones de tus juntas.

Estrellas
198★
Lenguaje
Go
Sample OpenAI
Oficial
Revisado
22 may 2026
Lo que ofrece

De un vistazo, lo que vas a obtener si lo instalas.

  • ·
    Realtime API en producción

    Es el patrón oficial canónico de OpenAI. Si pegas con la API, este es el código a estudiar primero.

  • ·
    WebRTC bidireccional

    Audio en vivo de múltiples participantes mezclado, mandado al modelo, respuesta sincronizada.

  • ·
    Function calling integrado

    El asistente no solo escucha, decide cuándo actualizar el Kanban vía tool calls reales.

  • ·
    Stack Go limpio

    Pion WebRTC + Gorilla WebSocket + Opus. Cero dependencias raras, todo open source.

  • ·
    Punto de partida educativo

    198 estrellas en una semana porque la gente quería ver "cómo lo hacen ellos".

Por qué importa

El contexto detrás del repo.

Es el demo oficial de OpenAI para Realtime API en un caso de uso concreto: una junta de standup donde varios participantes hablan al mismo tiempo, el sistema escucha, y un asistente IA actualiza el Kanban con función calling según lo que se discute. Está implementado en Go con Pion WebRTC, audio Opus, y la integración Realtime + WebRTC.

Lo interesante no es el código en sí —es ejemplo, no producto— sino el patrón que ilustra. Mezcla audio de múltiples participantes en un solo stream, lo manda a Realtime, y deja que el modelo decida cuándo intervenir y qué tool call hacer. Es la arquitectura canónica para asistentes de juntas, transcripción en vivo y otros productos voz-driven.

Las 198 estrellas en una semana se entienden por el peso de la marca: cuando OpenAI muestra "así se usa Realtime", todo el mundo abre el código a ver. Si construyes algo en este espacio, vale leer el sample antes que cualquier blogpost de terceros.

Para qué te sirve

Cuándo lo recomiendo (y cuándo no).

Lo recomiendo como referencia obligatoria si vas a construir cualquier producto con voz en tiempo real: asistentes de juntas, transcripción y resumen automático, comandos por voz a sistemas empresariales, dictado estructurado para CRM.

No lo despliegues como está. Es demo, no incluye autenticación ni control de acceso (el propio README lo advierte) y la lógica de negocio es mínima. Es código para estudiar el patrón, no para clonar y vender.

Cómo arrancarlo

En 3 pasos, listo para probar.

  1. 01

    Clona y configura

    git clone https://github.com/openai/openai-realtime-meeting-assistant.git
    cd openai-realtime-meeting-assistant
    export OPENAI_API_KEY=tu_api_key

    La API key tiene que estar en el entorno antes de arrancar el server. El sample no carga .env automáticamente — lee directo de las variables de entorno.

  2. 02

    Instala las dependencias del sistema

    # macOS
    brew install opus pkg-config
    
    # Linux (Ubuntu/Debian)
    sudo apt install libopus-dev pkg-config

    Necesitas Go 1.24 o más nuevo y la librería Opus disponible vía pkg-config. El sample usa Opus para codec de audio.

  3. 03

    Arranca el servidor

    go run .

    La app queda en http://localhost:3000. Abres en varios navegadores para simular participantes. El asistente IA escucha, transcribe, y actualiza el Kanban compartido cuando detecta una decisión.

Por qué este sample tiene peso desproporcionado

OpenAI publica pocos samples completos. Cuando lo hacen, marca cómo "ellos creen" que deberías usar la API. La comunidad copia ese patrón, los proveedores de tooling lo adoptan, y se vuelve referencia.

Si trabajas con Realtime API, leer este código una vez te ahorra meses de prueba y error sobre cómo manejar el round-trip de audio, cómo estructurar function calling en contexto de voz, cómo manejar la latencia.

Qué falta para producción

El propio README advierte: no incluye autenticación, no incluye control de acceso, la lógica de negocio del Kanban es básica. Si lo quieres a producción:

  • Capa de auth y autorización.
  • Persistencia real (el Kanban del demo vive en memoria).
  • Rate limiting y observabilidad.
  • Manejo de fallas de red sin perder estado.

Todo eso es trabajo tuyo. El demo te da los huesos, no el producto.

Mi recomendación

Si vas a tocar Realtime API, leer este código es la primera tarea, antes de cualquier tutorial o blogpost. Si solo te interesa el caso de uso (asistente de juntas), considera evaluar Otter.ai, Fireflies o productos similares antes de construir desde cero — el costo de mantenimiento es real.

De Gabriel Neuman para tu equipo

¿Quieres automatizar la captura de decisiones de tus juntas?

Si tu equipo gasta horas en transcribir, resumir o capturar acuerdos de juntas, te ayudo a montar el sistema —con OpenAI Realtime u otra arquitectura— que automatiza eso. Una llamada para entender tu flujo.