helpВопросы

Часто задаваемые вопросы

Ответы на самые популярные вопросы о платформе Айва, технологиях и интеграциях.

1.Ядро технологий: На какой платформе построен бот (собственная разработка или на базе Google Dialogflow, Amazon Lex, Yandex Alisa и других)?

Собственная разработка - оркестратор. Модульная архитектура позволяет подключать разные провайдеры ASR, TTS, LLM и интегрироваться с внешними системами.

2.Чьи технологии используются для распознавания речи (Speech-to-Text)? Есть ли поддержка различных акцентов, диалектов, спонтанной речи с паузами, исправлениями?

Поддерживаются несколько движков распознавания: Google, Groq, OpenAI, Yandex, собственный inference. Система устойчиво обрабатывает акценты, паузы, спонтанную речь и самокоррекции.

3.Чьи технологии используются для синтеза речи (Text-to-Speech)? Какие голоса доступны (мужские, женские, нейтральные)? Можно ли настроить тембр, скорость, интонации?

Используются голоса провайдеров (включая Google). Доступно 10+ вариантов голосов. Отдельно через промпт настраиваются тембр, скорость, паузы, интонации. Возможна бренд-кастомизация голоса.

4.Как бот понимает контекст диалога? Может ли он поддерживать многоходовый диалог с уточнениями?

Да. Используется сценарный промпт, контекстная память диалога и логика ветвления сценариев. Рекомендуем формировать промпты на основе записей реальных звонков для учета всех бизнес сценариев.

5.Как обрабатывает опечатки, жаргонизмы, сложные формулировки?

Ошибки, разговорные конструкции и жаргон обрабатываются корректно. Возможна дообучаемая словарная модель под специфику отрасли или конкретного бизнеса.

6.Есть ли встроенные сценарии (интенты) для отрасли (например, для записи к врачу, бронирования столиков, службы поддержки)?

Под каждый сценарий формируется отдельный промпт с интеграциями. Например, агент может обращаться к БД за доступными слотами и создавать заявку или лид.

7.С какими системами легко интегрируется (CRM – AmoCRM, Битрикс24; телефония; 1С; базы знаний; мессенджеры)?

Поддерживаются интеграции с CRM-системами, телефонией, 1С, базами знаний, мессенджерами. Возможна разработка кастомных коннекторов под требования заказчика.

8.Где и как хранятся данные разговоров? Обеспечиваете ли вы соответствие 152-ФЗ (для РФ) или GDPR?

Записи разговоров и расшифровки хранятся на российских серверах.

9.Скорость ответа: Каково среднее время отклика бота от конца реплики клиента до начала ответа (в миллисекундах)?

Среднее время отклика — 600–700 мс (при стабильном канале связи).

10.Пропускная способность: Сколько одновременных разговоров может вести система? Как она масштабируется при пиковых нагрузках (например, во время рекламной акции)?

Система развернута в Kubernetes и масштабируется on-demand под пиковые нагрузки (акции, массовые кампании, сезоны).

11.Источник голосов: Используются ли стандартные голоса (от Google, Amazon, Yandex) или созданы собственные?

Базово используются стандартные голоса провайдеров, при необходимости можно подключать и использовать кастомные голоса.

12.Качество и натуральность: Можно ли услышать живые примеры (демо-записи)? Насколько речь эмоциональна и естественна (технология нейросетевого TTS)?

Используются нейросетевые TTS-модели. Возможно предоставление демо-записей. Качество речи регулярно улучшается по мере обновления провайдеров моделей.

13.Можно ли настроить голос под наш бренд (пол, возраст, характер)?

Да - можем подобрать тембр, эмоциональность, стиль и речевой характер.

14.Возможно ли создать синтезированный голос ключевого сотрудника или бренд-персоны?

Возможно.

15.Можно ли менять скорость речи, расставлять акценты на ключевых словах, добавлять паузы?

Да, поддерживается настройка скорости, пауз, логических ударений и акцентов.

16.Музыка и аудио: Предоставляете ли вы услуги записи приветственных сообщений, джинглов, фоновой музыки?

Да, можно.

17.Модель оплаты: Какова модель ценообразования (помесячная/годовая подписка, оплата за минуту разговора, оплата за успешный диалог)?

Поминутная тарификация с приобретением пакетов минут. Стоимость от 8 до 15 рублей. Чем больше минут, тем меньше цена.

18.Сроки внедрения: Сколько времени займет настройка и запуск типового и нетипового проекта?

Типовой проект: настройка промпта — 1–3 дня, настройка телефонии — 1–3 дня. Сроки нетиповых проектов зависят от объема интеграций.

19.Кто настраивает: Мы настраиваем бота сами через конструктор или ваши специалисты?

Доступен веб-интерфейс для самостоятельной настройки. Можно использовать своих специалистов или привлекать нашу команду для консультаций и сопровождения.

20.Обучение бота: Как происходит первичное обучение бота? Как легко можно добавлять новые вопросы и ответы после запуска?

Первичное обучение выполняется на основе записей реальных диалогов и бизнес-кейсов. Изменения в промпте применяются мгновенно и сразу попадают в прод.

21.Аналитика и отчеты: Какие данные предоставляет система (записи разговоров, текстовые расшифровки, карта диалога, метрики: процент решения проблемы, причина перехода на оператора, тональность)?

Доступны: записи разговоров, расшифровки, определение интента, классификация результата, базовые метрики. Расширенная аналитика - в разработке.

22.Ключевое преимущество: В чем ваше главное отличие от других решений на рынке (не цена, а технология или результат)?

Гибкая архитектура оркестратора с возможностью подключения лучших моделей рынка и быстрой адаптации под конкретные бизнес-процессы клиента.

Остались вопросы?

Свяжитесь с нами, и мы ответим на все ваши вопросы о платформе Айва.