OpenAI Whisper: транскрипція аудіо та відео на VPS

AI-агенти на VDS · 19.04.2026

OpenAI Whisper: транскрипція аудіо та відео на VPS

Whisper — open-source модель розпізнавання мовлення від OpenAI, що підтримує 99 мов включно з українською. Працює локально на VPS.

Встановлення

apt install -y ffmpeg
pip install openai-whisper

Python API

import whisper
model = whisper.load_model("medium")
result = model.transcribe("audio.mp3", language="uk")
print(result["text"])

Faster-Whisper (4x швидше)

pip install faster-whisper

from faster_whisper import WhisperModel
model = WhisperModel("medium", device="cpu", compute_type="int8")
segments, info = model.transcribe("audio.mp3", language="uk")
for s in segments:
    print(f"[{s.start:.2f}s] {s.text}")

Рекомендації: Модель small — швидко та точно. medium — найкраща якість для більшості задач.