PLYNTE LIVEAUDIO v1.2.0 · WINDOWS Y LINUX

Subtítulos locales en tiempo real para tu OBS.Sin nube, sin suscripción, sin API key.

LiveAudio es una app gratuita y de código abierto (MIT) que genera subtítulos de voz en tiempo real con Whisper, 100% en tu equipo, y los envía a OBS por un WebSocket local. Funciona en Windows y Linux. Sin nube, sin API key, sin costo por minuto.

  • 100% local
  • Código abierto MIT
  • Windows + Linux
subtitulos_obs.html
ws://127.0.0.1:8765
  • id1046text"así es como el pipeline l…"latency1.08stotal_delay1.27sis_replayfalse
  • id1045text"Whisper turbo está decodi…"latency1.12stotal_delay1.32sis_replayfalse
  • id1044text"Silero VAD acaba de recor…"latency1.16stotal_delay1.37sis_replayfalse
  • id1043text"los subtítulos van direct…"latency1.20stotal_delay1.42sis_replaytrue
Vista previa en vivo · ilustrativo

// por qué LiveAudio

Respuestas directas a las objeciones reales.

// 100% local

¿De verdad es 100% local?

Todo el procesamiento ocurre en tu equipo, sin telemetría. Internet solo en la primera ejecución para descargar Python, dependencias y modelos; después funciona sin conexión.

sin telemetría · sin conexión tras la primera ejecución

// linux

¿Funciona en Linux?

Sí. Linux x86_64 captura por micrófono y necesita libportaudio2. El loopback de audio del sistema (WASAPI) es solo de Windows.

linux x86_64 · sudo apt install libportaudio2

loopback solo Windows

// gpu

¿Necesito una GPU?

No. La CPU funciona. NVIDIA CUDA es opcional pero recomendada: se detecta sola y necesita driver ≥ 525 y VRAM ≥ 4 GiB.

la cpu funciona · cuda driver ≥ 525 · vram ≥ 4 GiB

// el camino de la señal

Del micrófono a OBS en cuatro etapas.

En palabras simples: LiveAudio escucha tu voz, convierte el habla en texto al instante y envía esos subtítulos a OBS — todo en tu propio equipo. Ese motor de voz a texto (ASR, reconocimiento de voz automático) corre localmente en cuatro etapas, estable gracias a procesos aislados, un búfer de audio en anillo y reconexión automática.

  1. Captura

    Toma un micrófono físico o el audio del sistema (loopback WASAPI en Windows; micrófono en Linux). El búfer en anillo mantiene el audio fluyendo bajo carga.

    micrófono · loopback del sistema (windows)
  2. Filtra

    Silero VAD recorta el silencio con un pre-roll de inicio y un umbral configurables, para que Whisper solo decodifique voz real.

    silero-vad · pre-roll de inicio + umbral
  3. Decodifica

    Acá el habla se vuelve texto. Whisper transcribe en tiempo real — tiny, base, small o turbo — en CPU o CUDA opcional. Una blacklist de alucinaciones filtra texto basura.

    whisper · tiny / base / small / turbo
  4. Emite

    Los subtítulos van directo a OBS por una conexión local — JSON limpio que OBS o cualquier app de tu computadora puede leer. Menos de un segundo hasta ~1 s, ajustable por perfil. (La dirección exacta está en letra chica abajo.)

    ws://127.0.0.1:8765

DEMO EN VIVO

Mira LiveAudio funcionando en vivo.

Una grabación real de la app generando subtítulos — no es una maqueta.

captura real

Captura real — LiveAudio v1.2.0, sin ediciones. Interfaz en inglés.

// integración

Funciona con OBS — o cualquier cliente WebSocket.

LiveAudio emite subtítulos en JSON limpio por un WebSocket local (ws://127.0.0.1:8765). OBS es el destino integrado mediante el overlay subtitulos_obs.html, pero cualquier cliente HTML o WebSocket en localhost puede conectarse y recibir la misma transmisión — así puedes construir tu propio consumidor o integrarlo con otras herramientas locales. Solo se aceptan conexiones desde localhost; no requiere autenticación.

ws://127.0.0.1:8765
{
  "id": 482,
  "text": "subtítulos locales en tiempo real",
  "style": "live",
  "latency": 1.1,
  "total_delay": 1.3,
  "is_replay": false
}

// incluido

Siete herramientas integradas: overlay de cinta adaptable, cambio de dispositivo y modelo en caliente, perfiles según FPS, blacklist de alucinaciones, archivos de sesión, diagnóstico local y actualizaciones en la app.

// overlay obs nuevo en v1.2.0

Overlay de cinta adaptable

El overlay de OBS suma un búfer de subtítulos en “cinta” vertical adaptable, con mejor legibilidad de los subtítulos y un tiempo de animación de aparición acotado.

// hot-swap

Cambio de dispositivo y modelo en caliente

Cambia el dispositivo de audio o el modelo de Whisper sin reiniciar. Aplica los cambios y el motor se reconfigura en vivo.

// perfiles

Perfiles que cuidan los FPS

Los presets Fast, Balanced, Quality y Stable Streaming equilibran la latencia con la carga de GPU mientras juegas.

// blacklist

Blacklist de alucinaciones

Una blacklist editable filtra las frases basura que Whisper inventa en el silencio — y tú controlas la lista.

// archivos de sesión

Archivos de sesión

Cada ejecución guarda transcript.jsonl y subtitles.vtt (más session.json), así nada válido se pierde.

// diagnóstico

Diagnóstico local

La exportación sanea secretos y rutas y excluye audio crudo y transcripciones completas. Sin telemetría, nunca.

// actualizaciones

Actualizaciones en la app

Actualización en un clic dentro de la app, o ejecuta el launcher con --update. Las versiones nuevas llegan sin reinstalar.

Simulado / ilustrativoEstos sandboxes son una vista previa interactiva — imitan los controles, no la app real. Los números mostrados son ilustrativos.

// sandboxes interactivos

Seis controles, seis sandboxes en vivo.

Cada ajuste de LiveAudio es una perilla que podés probar antes de descargar. Perfiles, modelos Whisper, la blacklist de alucinaciones, la política de backlog de OBS, cambio de dispositivos en caliente y Silero VAD — probá cada uno abajo.

sandbox activo

// perfiles

Perfiles que consideran los FPS

Fast, Balanced, Quality y Stable Streaming reajustan latencia, modelo y filtro de silencio en conjunto. Editar uno integrado crea un perfil Custom; aplicá los cambios para activarlo.

El balance recomendado entre velocidad y precisión.

Latencia~0.6 s
VRAM~480 MB
Corte VAD0.8 s
Simulado / ilustrativo
estadolisto

Presets sensibles a los FPS: Fast / Balanced / Quality / Stable Streaming.

// la versión corta

Cómo se compara LiveAudio de un vistazo.

LiveAudio ASR en la nube / plugins
100% local Sí: depende de la nube
$0 de costo por minuto Sí: se cobra por minuto
Sin API key Sí: normalmente sí
Loopback de audio del sistema Condicional: solo Windows varía

Ver la comparativa completa

// respuestas

Las preguntas que aparecen primero.

¿De verdad es 100% local?

Sí. Todo el procesamiento ocurre en tu equipo, sin telemetría. Internet solo en la primera ejecución para descargar Python, dependencias y modelos; después funciona sin conexión.

¿Funciona en Linux?

Sí, en Linux x86_64 con captura por micrófono (necesita libportaudio2). El loopback de audio del sistema es solo de Windows.

¿Es gratis y de código abierto?

Sí. LiveAudio es gratuito y de código abierto bajo licencia MIT. Sin suscripción y sin API key.

¿Cuál es la latencia?

Latencia baja y ajustable — bastante menos de un segundo en un equipo típico. Los perfiles equilibran latencia, precisión y carga de GPU.

Leer las FAQ completas

// descargar

Subtítulos locales en tu OBS en minutos.

Gratis y de código abierto (MIT). Sin suscripción, sin API key. Solo pagas tu propia electricidad — el hardware no está incluido.

v1.2.0 Detectando SO…
Descargar LiveAudio v1.2.0 (gratis)