📖 voisemp3 — полная инструкция

Нейросетевая озвучка текста · ИП Шпагин В.О. · 30 июня 2026

Содержание 1. Что это 2. Как пользоваться 3. Голоса 4. Токены и тарифы 5. Промокоды 6. API-ключи 7. Расшифровка аудио (ASR) Контакты

1. Что это

voisemp3 — это нейросетевой сервис озвучки текста (TTS). Вы вводите текст, выбираете голос — получаете аудиофайл в форматах MP3, WAV или OPUS.

Работает на собственном оборудовании: RTX 4090 (24GB VRAM) в дата-центре, модель Qwen3-TTS, без внешних API.

Сервис понимает русский и английский языки. Можно озвучивать статьи, книги, посты, рекламу — любые тексты до 5 000 символов за раз.

2. Как пользоваться

Зарегистрируйтесь — нужна почта на Яндексе (@yandex.ru, @ya.ru, @yandex.by, @yandex.kz)
Подтвердите email — придёт код из 6 цифр
Войдите в аккаунт
Введите текст в поле ввода (или загрузите файл .txt)
Выберите голос: Ryan (мужской), Serena (женский) или Clone (имитация)
Выберите формат: MP3 / WAV / OPUS
Нажмите «Сгенерировать» или Ctrl+Enter
Скачайте готовый аудиофайл

💡 Подсказка: для имитации голоса (Clone) нужен образец — загрузите WAV-файл с голосом, который хотите скопировать.

3. Голоса

Голос	Тип	Языки	Особенность
Ryan	Мужской	RU, EN	Уверенный, дикторский
Serena	Женский	RU, EN	Мягкий, естественный
Clone	Имитация	RU, EN	Копирует загруженный голос

Генерация детерминирована: один и тот же текст с одним голосом всегда даёт одинаковый звук. Можете повторять генерацию сколько угодно — результат не изменится.

4. Токены и тарифы

Как считаются токены

1 символ = 1 токен. Сколько символов в тексте — столько токенов спишется. Минимум 2, максимум 5 000 символов за запрос. Правило действует и для озвучки (TTS), и для расшифровки (ASR).

Бесплатный старт

При регистрации — 10 000 токенов бесплатно. Это примерно 1 500–2 000 слов или 8–12 страниц текста. Баланс сбрасывается до 10 000 каждый месяц.

Тарифы

План	Цена	Токенов/мес	Голосов	Макс. символов	Лицензия
Бесплатный	0 ₽	10 000	1	1 000	Личная
Старт	199 ₽/мес	50 000	3	2 000	Коммерческая
Базовый	499 ₽/мес	250 000	10	3 000	Коммерческая
Книжный	999 ₽/мес	1 000 000	10	5 000	Коммерческая
Премиум	2 499 ₽/мес	500 000	10	5 000	Коммерческая

Промокоды дают дополнительные токены. Их создаёт администратор и передаёт знакомым.

Как активировать

Войдите в аккаунт
Нажмите на свой аватар в правом верхнем углу
В выпадающем меню найдите поле «Промокод»
Введите код и нажмите → (или Enter)
Токены сразу зачислятся на баланс

Один пользователь может активировать промокод только один раз. Количество использований ограничено — когда лимит исчерпан, код перестаёт работать.

6. API-ключи

API-ключ позволяет вызывать озвучку программно — из скриптов, ботов, приложений.

Создать ключ

В личном кабинете (SPA) прокрутите до раздела «API ключи» → нажмите «Создать ключ». Формат: sk- + 48 hex-символов (192 бита).

Использовать

curl -X POST https://voisemp3.ru/api/tts \
  -H "Authorization: Bearer sk-ВАШ_КЛЮЧ" \
  -H "Content-Type: application/json" \
  -d '{"text":"Привет мир","speaker":"ryan"}'

import requests
r = requests.post("https://voisemp3.ru/api/tts",
  headers={"Authorization": "Bearer sk-..."},
  json={"text":"Привет мир","speaker":"ryan"})
print(r.json()["url"])  # ссылка на WAV-файл

API возвращает JSON с полями: url (WAV), url_mp3, url_opus, duration_sec, balance_remaining.

7. Расшифровка аудио (ASR)

Сервис умеет не только озвучивать, но и расшифровывать аудио в текст. Используется Whisper (openai-whisper v20250625).

curl -X POST https://voisemp3.ru/api/asr \
  -H "Authorization: Bearer sk-..." \
  -F "file=@audio.wav" \
  -F "language=ru"

Поддерживаемые форматы: WAV, MP3, OPUS, FLAC, OGG. Язык: ru или en.

Контакты

Поддержка: voisemp3@gmail.com
Сайт: voisemp3.ru
Админ: /admin.html (только для администратора)
Реквизиты: /requisites.html
Обратная связь: форма в футере сайта
Владелец: ИП Шпагин Виталий Олегович

voisemp3 · нейросетевая озвучка текста · 2026