Часто задаваемые вопросы
Ответы на самые популярные вопросы о платформе Айва, технологиях и интеграциях.
1.Ядро технологий: На какой платформе построен бот (собственная разработка или на базе Google Dialogflow, Amazon Lex, Yandex Alisa и других)?
Собственная разработка - оркестратор. Модульная архитектура позволяет подключать разные провайдеры ASR, TTS, LLM и интегрироваться с внешними системами.
2.Чьи технологии используются для распознавания речи (Speech-to-Text)? Есть ли поддержка различных акцентов, диалектов, спонтанной речи с паузами, исправлениями?
Поддерживаются несколько движков распознавания: Google, Groq, OpenAI, Yandex, собственный inference. Система устойчиво обрабатывает акценты, паузы, спонтанную речь и самокоррекции.
3.Чьи технологии используются для синтеза речи (Text-to-Speech)? Какие голоса доступны (мужские, женские, нейтральные)? Можно ли настроить тембр, скорость, интонации?
Используются голоса провайдеров (включая Google). Доступно 10+ вариантов голосов. Отдельно через промпт настраиваются тембр, скорость, паузы, интонации. Возможна бренд-кастомизация голоса.
4.Как бот понимает контекст диалога? Может ли он поддерживать многоходовый диалог с уточнениями?
Да. Используется сценарный промпт, контекстная память диалога и логика ветвления сценариев. Рекомендуем формировать промпты на основе записей реальных звонков для учета всех бизнес сценариев.
5.Как обрабатывает опечатки, жаргонизмы, сложные формулировки?
Ошибки, разговорные конструкции и жаргон обрабатываются корректно. Возможна дообучаемая словарная модель под специфику отрасли или конкретного бизнеса.
6.Есть ли встроенные сценарии (интенты) для отрасли (например, для записи к врачу, бронирования столиков, службы поддержки)?
Под каждый сценарий формируется отдельный промпт с интеграциями. Например, агент может обращаться к БД за доступными слотами и создавать заявку или лид.
7.С какими системами легко интегрируется (CRM – AmoCRM, Битрикс24; телефония; 1С; базы знаний; мессенджеры)?
Поддерживаются интеграции с CRM-системами, телефонией, 1С, базами знаний, мессенджерами. Возможна разработка кастомных коннекторов под требования заказчика.
8.Где и как хранятся данные разговоров? Обеспечиваете ли вы соответствие 152-ФЗ (для РФ) или GDPR?
Записи разговоров и расшифровки хранятся на российских серверах.
9.Скорость ответа: Каково среднее время отклика бота от конца реплики клиента до начала ответа (в миллисекундах)?
Среднее время отклика — 600–700 мс (при стабильном канале связи).
10.Пропускная способность: Сколько одновременных разговоров может вести система? Как она масштабируется при пиковых нагрузках (например, во время рекламной акции)?
Система развернута в Kubernetes и масштабируется on-demand под пиковые нагрузки (акции, массовые кампании, сезоны).
11.Источник голосов: Используются ли стандартные голоса (от Google, Amazon, Yandex) или созданы собственные?
Базово используются стандартные голоса провайдеров, при необходимости можно подключать и использовать кастомные голоса.
12.Качество и натуральность: Можно ли услышать живые примеры (демо-записи)? Насколько речь эмоциональна и естественна (технология нейросетевого TTS)?
Используются нейросетевые TTS-модели. Возможно предоставление демо-записей. Качество речи регулярно улучшается по мере обновления провайдеров моделей.
13.Можно ли настроить голос под наш бренд (пол, возраст, характер)?
Да - можем подобрать тембр, эмоциональность, стиль и речевой характер.
14.Возможно ли создать синтезированный голос ключевого сотрудника или бренд-персоны?
Возможно.
15.Можно ли менять скорость речи, расставлять акценты на ключевых словах, добавлять паузы?
Да, поддерживается настройка скорости, пауз, логических ударений и акцентов.
16.Музыка и аудио: Предоставляете ли вы услуги записи приветственных сообщений, джинглов, фоновой музыки?
Да, можно.
17.Модель оплаты: Какова модель ценообразования (помесячная/годовая подписка, оплата за минуту разговора, оплата за успешный диалог)?
Поминутная тарификация с приобретением пакетов минут. Стоимость от 8 до 15 рублей. Чем больше минут, тем меньше цена.
18.Сроки внедрения: Сколько времени займет настройка и запуск типового и нетипового проекта?
Типовой проект: настройка промпта — 1–3 дня, настройка телефонии — 1–3 дня. Сроки нетиповых проектов зависят от объема интеграций.
19.Кто настраивает: Мы настраиваем бота сами через конструктор или ваши специалисты?
Доступен веб-интерфейс для самостоятельной настройки. Можно использовать своих специалистов или привлекать нашу команду для консультаций и сопровождения.
20.Обучение бота: Как происходит первичное обучение бота? Как легко можно добавлять новые вопросы и ответы после запуска?
Первичное обучение выполняется на основе записей реальных диалогов и бизнес-кейсов. Изменения в промпте применяются мгновенно и сразу попадают в прод.
21.Аналитика и отчеты: Какие данные предоставляет система (записи разговоров, текстовые расшифровки, карта диалога, метрики: процент решения проблемы, причина перехода на оператора, тональность)?
Доступны: записи разговоров, расшифровки, определение интента, классификация результата, базовые метрики. Расширенная аналитика - в разработке.
22.Ключевое преимущество: В чем ваше главное отличие от других решений на рынке (не цена, а технология или результат)?
Гибкая архитектура оркестратора с возможностью подключения лучших моделей рынка и быстрой адаптации под конкретные бизнес-процессы клиента.
Остались вопросы?
Свяжитесь с нами, и мы ответим на все ваши вопросы о платформе Айва.
