OpenAI Whisper: транскрипція аудіо та відео на VPS
Whisper — open-source модель розпізнавання мовлення від OpenAI, що підтримує 99 мов включно з українською. Працює локально на VPS.
Встановлення
apt install -y ffmpeg
pip install openai-whisperPython API
import whisper
model = whisper.load_model("medium")
result = model.transcribe("audio.mp3", language="uk")
print(result["text"])Faster-Whisper (4x швидше)
pip install faster-whisperfrom faster_whisper import WhisperModel
model = WhisperModel("medium", device="cpu", compute_type="int8")
segments, info = model.transcribe("audio.mp3", language="uk")
for s in segments:
print(f"[{s.start:.2f}s] {s.text}")Рекомендації: Модель
small — швидко та точно. medium — найкраща якість для більшості задач.