El Azure AI Voice Live SDK (azure-ai-voicelive) permite crear aplicaciones de voz en tiempo real, bidireccionales y de baja latencia en Python mediante com…
El Azure AI Voice Live SDK (azure-ai-voicelive) permite crear aplicaciones de voz en tiempo real, bidireccionales y de baja latencia en Python mediante comunicación estilo WebSocket. Las características clave incluyen la gestión asíncrona del contexto connect(), session.update para establecer instrucciones, modalidades y selección de voz, transmisión por eventos de audio_transcript y response.audio, y soporte para modelos como gpt-4o-realtime-preview. La autenticación admite flujos seguros DefaultAzureCredential (recomendado) y AzureKeyCredential para escenarios con clave API. Los casos de uso típicos incluyen asistentes de voz en tiempo real, transcripción en vivo, sistemas IVR conversacionales, herramientas de accesibilidad, conferencias virtuales y experiencias de streaming interactivas. Las ventajas principales son la integración estrecha con Azure Cognitive Services, E/S asíncrona de Python para sesiones concurrentes escalables, instrucciones de sesión y modalidades configurables, y la interacción de audio/texto bidireccional de baja latencia para flujos conversacionales con buena capacidad de respuesta.
Esta página forma parte del hub OpenClaw Skills con guías de instalación, categorías y enlaces prácticos.