Reemplazar Web Speech API con Edge TTS para soporte de CarPlay/Bluetooth by ricardoalfaro · Pull Request #1 · ricardoalfaro/textreader

ricardoalfaro · 2026-05-10T05:31:07Z

Problema

speechSynthesis en iOS Safari usa una sesión de audio distinta a la de CarPlay y Bluetooth. El audio del lector solo salía por el altavoz del teléfono o auriculares, nunca por el sistema de audio del coche ni dispositivos BT. Es una limitación del sistema operativo — no hay forma de corregirla dentro de la Web Speech API.

Solución

Reemplazar speechSynthesis con Edge TTS de Microsoft: un servicio gratuito (sin API key) que expone un endpoint WebSocket que el navegador Edge usa internamente. La respuesta es un MP3 que se reproduce con un elemento <audio> HTML, que sí enruta correctamente a CarPlay y Bluetooth en iOS.

Cambios

`app.js` (reescritura completa)

Nuevo cliente synthesizeEdgeTTS() sobre WebSocket (wss://speech.platform.bing.com/...)
Lista de voces neurales hardcodeada: es-MX, es-ES, es-AR, es-CO, es-CL, en-US, en-GB
Chunking automático de textos largos (por párrafos y oraciones, máx. 1500 chars/chunk)
Reproducción secuencial de chunks via <audio> con gestión de Blob URLs
Se elimina el AudioContext silencioso (workaround que ya no es necesario)
Se mantiene MediaSession API, favoritos y localStorage

`index.html`

Agregar <audio id="audioPlayer"> para reproducción

`service-worker.js`

Bump de cache a v2 para forzar actualización en dispositivos con la versión anterior

Notas para revisar

El WebSocket de Edge TTS es una API no oficial pero estable — usada ampliamente en proyectos open source. Para uso personal es aceptable.
El preview panel de Claude está sandboxeado y no puede conectar al WebSocket externo; hay que probar en un navegador real (localhost:8787).
Si Microsoft cambia el token o el endpoint en el futuro, habría que actualizar synthesizeEdgeTTS().

El problema raíz era que speechSynthesis en iOS usa una sesión de audio diferente a la de CarPlay/Bluetooth, por lo que el audio nunca llegaba al coche ni a dispositivos Bluetooth. No hay forma de corregir esto dentro de la Web Speech API. Solución: reemplazar speechSynthesis con Edge TTS (servicio gratuito de Microsoft, sin API key) que devuelve un MP3, reproducido via <audio>. El elemento <audio> sí enruta correctamente a CarPlay y Bluetooth en iOS. Cambios principales: - app.js: nuevo cliente Edge TTS sobre WebSocket, voces neurales en español e inglés, chunking automático de textos largos, reproducción con <audio> - index.html: agregar elemento <audio id="audioPlayer"> - service-worker.js: bump cache a v2 para forzar actualización en clientes El AudioContext silencioso (workaround previo) se eliminó, ya no es necesario. Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>

ricardoalfaro · 2026-06-02T15:47:43Z

bien

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Reemplazar Web Speech API con Edge TTS para soporte de CarPlay/Bluetooth#1

Reemplazar Web Speech API con Edge TTS para soporte de CarPlay/Bluetooth#1
ricardoalfaro wants to merge 1 commit into
mainfrom
claude/hopeful-fermi-24bf42

ricardoalfaro commented May 10, 2026

Uh oh!

ricardoalfaro commented Jun 2, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

Conversation

ricardoalfaro commented May 10, 2026

Problema

Solución

Cambios

app.js (reescritura completa)

index.html

service-worker.js

Notas para revisar

Uh oh!

ricardoalfaro commented Jun 2, 2026

Uh oh!

Reviewers

Assignees

Labels

Projects

Milestone

Development

Uh oh!

1 participant

`app.js` (reescritura completa)

`index.html`

`service-worker.js`