Голограмма Microsoft копирует внешность человека и переводит на разные языки
Гарнитура смешанной реальности Microsoft HoloLens 2 Mixed Reality была главным гостем конференции Inspire 2019. Конечно, до тех пор, пока компания не продемонстрировала свои последние достижения в области искусственного интеллекта (ИИ). А, также, технологию создания голограмм в смешанной реальности.
Во время своего выступления на сцене Лас-Вегаса, исполнительный директор Microsoft Джулия Уайт (Julia White) показала, что из себя представляет новый проект. Разработка базируется на комбинациях захвата движения тела и голоса, Azure AI, и технологии HoloLens 2. Этим функциям удалось превратить презентатора в трёхмерную голограмму, которая использует для общения любой, уместный в данный момент, язык.
Честно говоря, увидев это видео впервые, захотелось себя ущипнуть. Сразу появились мысли рода: «Что, уже?», «Вот это да!» и «Скоро как в фильмах будет присылать друг другу голограммы вместо пассивно-активных тел».
Хочется рассказать о самом процессе, как это всё выглядело.
Итак, Джулия Уайт надевает гарнитуру Microsoft HoloLens 2, протягивает руку так, чтобы ладонь оставалась в поле зрения, а потом происходит нечто невероятное. Сразу после на её ладони появляется миниатюрная Джулия.
Проделав все манипуляции с этой крошечной голограммой, Уайт отдаёт простую голосовую команду, и зелёный человечек распадается на облако частиц, выстреливающих куда-то в сторону и превращающихся в фотореалистическое «я» Джулии.
Голограмма говорит часть оставшегося текста презентации на японском. Все основные индивидуальные характеристики «оригинала» сохранены – голос, манера речи, паузы. В этом заслуга уже технологии Neural Text-To-Speech (Neural TTS). Тоже от Microsoft. Она использует возможности ИИ для автоматического сбора данных о голосе на основе простых паттернов речи. Впечатляюще!
Сочетание смешанной реальности (MR) и Neural TTS может коренным образом изменить способы организации презентаций, лекций, конференций, заседаний, встреч для абсолютно любой отрасли. Позволит создать интересные презентации на нескольких языках одновременно.
Единственное, в данный момент технология находится в зачатке своего развития. Отсюда и стоимость.
К примеру, голограмма Джулии Уайт была сделана, считай, в идеальных условиях: в специализированной студии смешанной реальности Microsoft, оснащённой профессиональным видео оборудованием специально для съёмки MR.