Голограмма Microsoft копирует внешность человека и переводит на разные языки

21 июля 2019 г.
Просмотров: 1284
Голограмма Microsoft копирует внешность человека и переводит на разные языки

Гарнитура смешанной реальности Microsoft HoloLens 2 Mixed Reality была главным гостем конференции Inspire 2019. Конечно, до тех пор, пока компания не продемонстрировала свои последние достижения в области искусственного интеллекта (ИИ). А, также, технологию создания голограмм в смешанной реальности.

Во время своего выступления на сцене Лас-Вегаса, исполнительный директор Microsoft Джулия Уайт (Julia White) показала, что из себя представляет новый проект. Разработка базируется на комбинациях захвата движения тела и голоса, Azure AI, и технологии HoloLens 2. Этим функциям удалось превратить презентатора в трёхмерную голограмму, которая использует для общения любой, уместный в данный момент, язык.

Честно говоря, увидев это видео впервые, захотелось себя ущипнуть. Сразу появились мысли рода: «Что, уже?», «Вот это да!» и «Скоро как в фильмах будет присылать друг другу голограммы вместо пассивно-активных тел».

Хочется рассказать о самом процессе, как это всё выглядело. 

Итак, Джулия Уайт надевает гарнитуру Microsoft HoloLens 2, протягивает руку так, чтобы ладонь оставалась в поле зрения, а потом происходит нечто невероятное. Сразу после на её ладони появляется миниатюрная Джулия. 

Проделав все манипуляции с этой крошечной голограммой, Уайт отдаёт простую голосовую команду, и зелёный человечек распадается на облако частиц, выстреливающих куда-то в сторону и превращающихся в фотореалистическое «я» Джулии.

Голограмма говорит часть оставшегося текста презентации на японском. Все основные индивидуальные характеристики «оригинала» сохранены – голос, манера речи, паузы. В этом заслуга уже технологии Neural Text-To-Speech (Neural TTS). Тоже от Microsoft. Она использует возможности ИИ для автоматического сбора данных о голосе на основе простых паттернов речи. Впечатляюще!

Сочетание смешанной реальности (MR) и Neural TTS может коренным образом изменить способы организации презентаций, лекций, конференций, заседаний, встреч для абсолютно любой отрасли. Позволит создать интересные презентации на нескольких языках одновременно.

Единственное, в данный момент технология находится в зачатке своего развития. Отсюда и стоимость.

К примеру, голограмма Джулии Уайт была сделана, считай, в идеальных условиях: в специализированной студии смешанной реальности Microsoft, оснащённой профессиональным видео оборудованием специально для съёмки MR.

x
Подпишись на наш телеграм канал