Разработанные на базе Qostanai Hub голосовые помощники, способные полностью автоматизировать работу менеджеров первой линии, привлекли инвестиции на сумму свыше 100 тысяч долларов. Над амбициозным стартапом Automaton трудилась международная команда из более чем 16 специалистов, включая разработчиков из Казахстана, России, Черногории и Сербии.
По словам сооснователя и директора по продукту Эдгара Володькина, проект уже наладил сотрудничество с крупными игроками рынка, такими как группа компаний «Автодом» и Mobile Technology. Кроме того, совместно с ТОО «ЭПК-forfait» готовится к запуску масштабный проект для Костанайского региона. Несмотря на первоначальную ориентацию на экспорт, команда ставит перед собой цель сначала прочно закрепиться на казахстанском рынке, а затем выходить на международную арену.
Идея создания интеллектуальных помощников родилась в 2023 году в ходе общения Эдгара Володькина с программистом Антоном Кармановым из России. Первоначальный замысел – разработка «говорящих» терминалов – оказался значительно сложнее, чем предполагалось, но команда не отступила. «От момента появления идеи до первого питчинга прошло около 4–6 месяцев», – вспоминает Эдгар. Первую презентацию проекта провел GR-специалист Мирас Адамбаев на местном Demo Day, после чего стартап был представлен Багдату Мусину, занимавшему тогда пост министра цифрового развития, и экс-премьер-министру страны.
Работа над проектом велась в основном по вечерам и ночам. «Было тяжело, местами весело. Мы пробовали, ошибались, снова пробовали, искали решения и изучали огромное количество информации. Это тоже оказалось не так просто, потому что тогда еще толком не было информации по ИИ. Да и сейчас многие сложные core-решения приходится прорабатывать самостоятельно», – признается Эдгар Володькин. Команда активно использует современные инструменты, такие как Gemini, ChatGPT и Grok, а также делится частью своих наработок с сообществом, способствуя развитию отрасли.
В основе голосовых ассистентов лежат большие языковые модели (large language model), которые сегодня являются стандартом для большинства ИИ-компаний. «Применяются различные аудиомодели для понимания и синтеза голоса – TTS (text-to-speech) и STT (speech-to-text) модели соответственно», – поясняет сооснователь Automaton. Финансовый путь проекта начался с личных вложений команды. После неудачного опыта с первым непрофессиональным инвестором, который стал для стартапа ценным уроком, разработчики долгое время развивались на собственные средства, пока не привлекли нынешнего партнера и спонсора Евгения Алфеева.
Ожидается, что голосовые помощники начнут полноценно функционировать на предприятиях Костаная уже в начале декабря. При этом у стартапа уже есть действующие клиенты в Астане и Алматы, что подтверждает высокий спрос на технологию. На данный момент ассистенты стабильно работают на русском и английском языках, а команда активно занимается разработкой качественной казахскоязычной версии. Процесс обучения нейросетей идет двумя путями: через языковые инструкции и с помощью более сложного и дорогостоящего метода fine-tuning – дообучения моделей на больших массивах специально подготовленных данных.