← На главную

📖 voisemp3 — полная инструкция

Нейросетевая озвучка текста · ИП Шпагин В.О. · 30 июня 2026

Содержание 1. Что это 2. Как пользоваться 3. Голоса 4. Токены и тарифы 5. Промокоды 6. API-ключи 7. Расшифровка аудио (ASR) Контакты

1. Что это

voisemp3 — это нейросетевой сервис озвучки текста (TTS). Вы вводите текст, выбираете голос — получаете аудиофайл в форматах MP3, WAV или OPUS.

Работает на собственном оборудовании: RTX 4090 (24GB VRAM) в дата-центре, модель Qwen3-TTS, без внешних API.

Сервис понимает русский и английский языки. Можно озвучивать статьи, книги, посты, рекламу — любые тексты до 5 000 символов за раз.

2. Как пользоваться

  1. Зарегистрируйтесь — нужна почта на Яндексе (@yandex.ru, @ya.ru, @yandex.by, @yandex.kz)
  2. Подтвердите email — придёт код из 6 цифр
  3. Войдите в аккаунт
  4. Введите текст в поле ввода (или загрузите файл .txt)
  5. Выберите голос: Ryan (мужской), Serena (женский) или Clone (имитация)
  6. Выберите формат: MP3 / WAV / OPUS
  7. Нажмите «Сгенерировать» или Ctrl+Enter
  8. Скачайте готовый аудиофайл
💡 Подсказка: для имитации голоса (Clone) нужен образец — загрузите WAV-файл с голосом, который хотите скопировать.

3. Голоса

ГолосТипЯзыкиОсобенность
RyanМужскойRU, ENУверенный, дикторский
SerenaЖенскийRU, ENМягкий, естественный
CloneИмитацияRU, ENКопирует загруженный голос

Генерация детерминирована: один и тот же текст с одним голосом всегда даёт одинаковый звук. Можете повторять генерацию сколько угодно — результат не изменится.

4. Токены и тарифы

Как считаются токены

1 символ = 1 токен. Сколько символов в тексте — столько токенов спишется. Минимум 2, максимум 5 000 символов за запрос. Правило действует и для озвучки (TTS), и для расшифровки (ASR).

Бесплатный старт

При регистрации — 10 000 токенов бесплатно. Это примерно 1 500–2 000 слов или 8–12 страниц текста. Баланс сбрасывается до 10 000 каждый месяц.

Тарифы

ПланЦенаТокенов/месГолосовМакс. символовЛицензия
Бесплатный0 ₽10 00011 000Личная
Старт199 ₽/мес50 00032 000Коммерческая
Базовый499 ₽/мес250 000103 000Коммерческая
Книжный999 ₽/мес1 000 000105 000Коммерческая
Премиум2 499 ₽/мес500 000105 000Коммерческая

5. Промокоды

Промокоды дают дополнительные токены. Их создаёт администратор и передаёт знакомым.

Как активировать

  1. Войдите в аккаунт
  2. Нажмите на свой аватар в правом верхнем углу
  3. В выпадающем меню найдите поле «Промокод»
  4. Введите код и нажмите → (или Enter)
  5. Токены сразу зачислятся на баланс

Один пользователь может активировать промокод только один раз. Количество использований ограничено — когда лимит исчерпан, код перестаёт работать.

6. API-ключи

API-ключ позволяет вызывать озвучку программно — из скриптов, ботов, приложений.

Создать ключ

В личном кабинете (SPA) прокрутите до раздела «API ключи» → нажмите «Создать ключ». Формат: sk- + 48 hex-символов (192 бита).

Использовать

curl -X POST https://voisemp3.ru/api/tts \
  -H "Authorization: Bearer sk-ВАШ_КЛЮЧ" \
  -H "Content-Type: application/json" \
  -d '{"text":"Привет мир","speaker":"ryan"}'
import requests
r = requests.post("https://voisemp3.ru/api/tts",
  headers={"Authorization": "Bearer sk-..."},
  json={"text":"Привет мир","speaker":"ryan"})
print(r.json()["url"])  # ссылка на WAV-файл

API возвращает JSON с полями: url (WAV), url_mp3, url_opus, duration_sec, balance_remaining.

7. Расшифровка аудио (ASR)

Сервис умеет не только озвучивать, но и расшифровывать аудио в текст. Используется Whisper (openai-whisper v20250625).

curl -X POST https://voisemp3.ru/api/asr \
  -H "Authorization: Bearer sk-..." \
  -F "file=@audio.wav" \
  -F "language=ru"

Поддерживаемые форматы: WAV, MP3, OPUS, FLAC, OGG. Язык: ru или en.

Контакты

Поддержка: voisemp3@gmail.com
Сайт: voisemp3.ru
Админ: /admin.html (только для администратора)
Реквизиты: /requisites.html
Обратная связь: форма в футере сайта
Владелец: ИП Шпагин Виталий Олегович

voisemp3 · нейросетевая озвучка текста · 2026