Первого виртуального ассистента Станислав создал в 12 лет, научив бота решать несложные математические задачи. Интерес к точным наукам и технологиям в семье Ашмановых передавался по наследству: дед Станислава занимался линейным программированием (область математики), а отец еще в 1980-х увлекся речевыми технологиями и первым в России создал автоматическую проверку правописания. Сам Станислав в детстве интересовался роботами: изучал механику и программирование, участвовал в олимпиадах и ходил смотреть на соревнования по робототехнике, которые проходили в МГУ. Именно туда он в итоге и поступил на механико-математический факультет.

В 2015 году, спустя год после выпуска из МГУ, Станислав основал компанию «Нейросети Ашманова». «Мне всегда было интересно всё, что связано с взаимодействием человека и машины. Уже на последних курсах мехмата я понимал, что создам проект в сфере искусственного интеллекта. Мы в компании пробовали разные вещи, связанные с роботами, а в 2013 году запускали проект „Лекси“ и разрабатывали умную колонку с голосовым помощником. В итоге остановились на анализе больших данных: получали заказы, создавали рекомендательные системы, алгоритмы для распознавания лиц и автомобильных номеров и так далее», — вспоминает Станислав. Клиентами «Нейросетей Ашманова» стали Сбербанк, Тинькофф-Банк, «ВымпелКом», Yota и другие крупные компании. В 2017 году Станислав получил в управление основанную его отцом компанию «Наносемантика». Формального объединения бизнесов не было, но фактически «Нейросети Ашманова» и «Наносемантика» стали работать как одна компания.

Бизнес рос, но в 2018 году Станислав понял, что хочет запустить проект с сильной некоммерческой составляющей, который был бы полезен IT-сообществу. Так родилась идея Open Source-платформы, чтобы с ее помощью любой желающий мог бы создать текстового или голосового виртуального ассистента. «Я изучил рынок и понял, что в открытом доступе есть в основном движки для программистов. Это не может использовать непрофессионал, а я хочу, чтобы даже школьник мог за полчаса сделать виртуального ассистента», — объясняет Станислав.

СПРАВКА

Что такое Open Source?

Open Source — программное обеспечение с открытым исходным кодом (или его частью), альтернатива платному софту.


Такое программное обеспечение распространяется по открытой лицензии, пользоваться им может кто угодно. Крупнейшее хранилище Open Source-решений в мире — GitHub. Там публикуют свои репозитории (хранилища кода) как независимые разработчики, так и крупные компании, такие как Facebook, Apple, Google и другие. В IT-сообществе считается, что именно Open Source стал одним из главных драйверов развития технологий в последние годы.

По словам Станислава, запускать проекты в области речевых технологий сложно. Необходимые компоненты голосового помощника — распознавание речи («слух» виртуального ассистента) и синтез речи (его «голос»). Чтобы виртуальный помощник смог понимать человеческую речь и «разговаривать», нужно собрать массив данных (датасет) для обучения нейросетей и разметить их. В открытом доступе можно найти датасеты с записями голоса, но они не всегда отвечают задачам разработчиков, а иногда там хромает качество. За разметку такого количества данных приходится платить. Корпорации и банки могут позволить себе заплатить диктору для записи качественного датасета, а затем нанять разметчиков, а стартапы и независимые разработчики — нет.

Свой новый проект он назвал SOVA (Smart Open Virtual Assistant). Команда подключилась к его реализации, но основные ресурсы «Нейросетей Ашманова» и «Наносемантики» по-прежнему уходили на коммерческие заказы. Тогда Ашманов начал искать финансирование. «Я понимал, что в эту историю стоит ввязываться, если мы создадим платформу, интересную пользователям со всего мира, и работать придется не только с русским языком, но и с английским, китайским и испанским. Мы начали считать бюджет и искать инвестора. Смотрели разные варианты, от краудфандинговых платформ до венчурных фондов. В итоге финансирование нашло нас само и довольно быстро. В 2018 году я как-то раз остался в офисе один поздно вечером и услышал, что в коммерческом отделе звонит телефон. Я взял трубку — и так познакомился с людьми из НТИ и РВК, которые заинтересовались SOVA. Я знал про РВК, но не думал, что им эта история может быть интересна. По телефону мне сказали, что есть условие для получения финансирования: это должно быть платформенное решение, которое поможет рынку в целом. Я ответил, что у нас именно такой продукт», — рассказывает Станислав.

Переговоры длились почти год, проект пришлось серьезно доработать. «Какие-то части из проекта мы убрали, а другие добавили. Например, было требование от Дмитрия Пескова [генеральный директор АНО „Платформа НТИ“, спецпредставитель президента РФ по цифровому и технологическому развитию], что проект должен быть реализован в формате консорциума. То есть вокруг нашей Open Source-платформы должен сформироваться коллектив разработчиков. Теперь у нас в консорциуме есть, например, МФТИ и ДВФУ, и они делятся с нами аудиозаписями лекций. Существование в виде консорциума придает серьезный вес некоммерческой составляющей проекта», — рассказывает он. В августе 2019 года проект получил окончательное одобрение Межведомственной рабочей группы (МРГ) по реализации НТИ, и созданный РВК Фонд поддержки проектов НТИ решил инвестировать в SOVA более 300 млн рублей. «Когда мы узнали, что фонд одобрил наш проект и мы получим инвестиции, то сразу же начали искать новых сотрудников. Мы поняли, что теперь у нас хватит топлива на запуск платформы, — говорит Станислав. — Это деньги, которые мы не просто получаем и тратим. У нас есть KPI, и фонд следит за тем, чтобы эти KPI выполнялись. Как и любой инвестор, фонд хочет видеть, что мы эффективно используем деньги и достигаем результата. Поэтому финансирование мы получаем траншами».

ПОДРОБНОСТИ

8 млрд

голосовых ассистентов будет использоваться к 2023 году по прогнозам исследовательской фирмы Juniper Research


Это значит, что на одного активного пользователя будет приходиться два-три виртуальных помощника. При этом уже в 2019 году рынок голосовых помощников вырос до $49 млрд, что показало исследование CB Insights. Главными бенефициарами этого тренда пока остаются корпорации вроде Apple, Google и Amazon — у маленьких компаний и независимых разработчиков на развитие таких технологий не хватает ресурсов.

Сейчас над платформой SOVA работают около 80 человек: это разработчики, дата-сайентисты, лингвисты и другие специалисты. Проект «стартовал не с нуля», напоминает Станислав: в распоряжении SOVA есть все наработки «Нейросетей Ашманова» и «Наносемантики», реализующих проекты для крупнейших компаний России и СНГ, государственных ведомств. Прорабатывается вывод продуктов компании на международные рынки. Первый релиз запланирован на август 2020 года: на GitHub появится открытый код, и программисты смогут его скачивать и запускать на своих устройствах. «Программист сможет скачать всё необходимое. Мы опубликуем алгоритмы, данные, на которых эти алгоритмы можно обучить (массивы качественных размеченных аудиозаписей, текстов, словарей и так далее), дадим среду разработки, куда можно добавить навык для чат-бота или голосового помощника», — объясняет Станислав. «Готового» виртуального ассистента, текстового или голосового, пользователь сможет использовать как угодно. Например, встроить его в сайт, мобильное приложение и даже во внешнее устройство (умную колонку, автомобиль и так далее).

Главное — дать разработчикам возможность создавать виртуальных ассистентов под свои нужды, говорит Станислав: «Например, кто-то захочет создать виртуального ассистента, который будет рассказывать о птицах. Мы не можем этого предусмотреть, но мы дадим возможность загрузить в среду разработки справочник о птицах и научить алгоритм отвечать на вопросы о них». Разработчики, не имеющие собственных датасетов, смогут выбрать «голос» для своего ассистента: SOVA предоставит качественные датасеты с аудиозаписями, записанными мужскими, женскими и даже детскими голосами. Также можно будет воспользоваться готовыми словарями и сценариями. Это необходимо, чтобы виртуальный помощник смог вести диалог, например, понимать, что на приветствие нужно отвечать приветствием, и тому подобное.

Следующим шагом будет релиз SOVA Store — маркетплейса для сообщества разработчиков. Пользователи смогут создавать на платформе SOVA модули для создания и обучения виртуальных ассистентов, чтобы другие разработчики могли пользоваться ими (предполагается, что модули будут как бесплатными, так и платными). Модули — это дополнения для расширения возможностей созданных на платформе виртуальных помощников. В итоге вокруг SOVA возникнет полноценная экосистема, которая будет развиваться благодаря пользователям, уверен Станислав. На первых порах платформой смогут пользоваться только программисты, но уже сейчас разработчики SOVA делают всё, чтобы в будущем это могли делать люди без специальной подготовки. Всё, для чего сейчас нужно «копаться» в коде, можно будет сделать с помощью простого и понятного интерфейса. «Основными потребителями должны стать независимые разработчики и малый бизнес. С крупным бизнесом мы и так работаем, наши заказчики — корпорации, телеком-операторы, министерства. И мы продолжим это делать. А платформа поможет тем, кто не может себе позволить дорогостоящую разработку», — говорит Станислав.

Параллельно ведется работа над созданием собственного голосового ассистента SOVA и аппаратного обеспечения («железа»), но основной задачей остается запуск платформы. Станислав уверен, что рынок виртуальных помощников в будущем ждут изменения: в частности, они станут гиперперсонализированными. Обычные пользователи получат возможность создавать собственных голосовых помощников и настраивать их «под себя», выбирая голос, характер, чувство юмора и многое другое. Еще один тренд — массовое распространение. Люди по всему миру постепенно привыкают общаться с устройствами голосом, и скоро нормой станут вендинговые автоматы или стиральные машины со встроенными голосовыми помощниками. Но самое главное — такие помощники перестанут восприниматься как роботы, считает Станислав: «Мне кажется, людям нужны не столько функциональные голосовые ассистенты, которые могут включить музыку или заказать пиццу, сколько заточенные на общение. Особенно это нужно пожилым людям, которым сложно пользоваться смартфонами, и детям. Поэтому я уверен, что голосовые помощники станут намного более человечными».

справка

Какие проекты НТИ получили поддержку в 2019 году?

Система обслуживания электросетей на базе беспилотников «Канатоход»

Мобильный комплекс для летных проверок средств радиотехнического обеспечения полетов «Курсир»

Масштабируемая платформа для низкоорбитальных малых космических аппаратов «Спутникс»

Генотерапевтический противоопухолевый препарат «АнтионкоРАН-М»

Цифровые технологии в производстве высокотемпературных сверхпроводников (реализует компания «С-Инновации»)

Грузовой дрон ЭРА

Инженерные конкурсы и соревнования по морской робототехнике

Первый в России полигон для испытаний и сертификации беспилотников

Система для интеграции беспилотной и пилотируемой авиации в единое воздушное пространство RUTM-1

Управление распределенной энергетикой «А-Платформа»

Открытая платформа для виртуальных ассистентов SOVA

Виртуальная реальность для психопрофилактики Virry

Проект «Россия — страна мореходов XXI века»