Перейти к основному содержимому

Практика локальной диктовки

Блог Speech Dock

Разбираем офлайн speech-to-text, голосовой ввод в Linux и macOS, приватность и практические desktop-сценарии.

Сравнение

Speech Dock или Whisper.cpp: готовое приложение против движка

Чем готовое приложение для диктовки отличается от низкоуровневого движка вроде Whisper.cpp, что придётся собирать самому и как выбрать подходящий вариант под свою задачу.

Whisper.cppраспознавание речисравнениеофлайндиктовка
Основы

Офлайн-распознавание речи: что работает локально и где границы

Что такое офлайн speech-to-text, какие задачи распознавание речи решает прямо на устройстве без интернета и где проходит реальная граница локальной обработки.

офлайнраспознавание речиприватностьголосовой ввод
Linux

Голосовой ввод в Linux: X11, Wayland и рабочий процесс

Почему голосовой ввод в Linux устроен сложнее, чем кажется: чем отличаются X11 и Wayland для диктовки, как работает автовставка текста и как выстроить удобный desktop-процесс.

LinuxWaylandX11голосовой вводдиктовка