Япoния инвeстируeт в искусствeнный интeллeкт — прaвитeльствo строит суперкомпьютер для нужд частных корпораций. Сколько стоит занять первую строчку в рейтинге самых производительных систем? Зачем машину учат читать по губам? Об этом — в программе Вести.net.
Япония намерена вернуть себе первое место в рейтинге самых производительных суперкомпьютеров. По данным агентства Reuters, министерство экономики, торговли и индустрии потратит 173 миллиона долларов на систему, способную совершать 130 квадриллионов вычислений в секунду (иначе говоря — производительностью в 130 петафлопс). Как было заявлено, погоня за рекордом – не единственная цель. Идея японского правительства в том, чтобы вернуть стране звание технологического лидера в более широком смысле этого слова. Мощности суперкомпьютера предоставят японским компаниям, работающим в области искусственного интеллекта. Речь идет о разработке беспилотного транспорта, автоматизации производства, развитии медицины. Судя по заявлениям чиновников, это часть государственной программы продвижения японских компаний на самых быстрорастущих рынках – робототехники, возобновляемых источников и накопителей энергии.
Кто будет строить суперкомпьютер, пока неизвестно, конкурс завершится только через 10 дней. Самую быструю из действующих японских систем производительностью 13,5 петафлопса разрабатывала Fujitsu, она считается шестой в мире. Вообще, глобальный рейтинг сейчас возглавляют два китайских суперкомпьютера мощностью 93 и 34 петафлопса. Тут любопытно, что текущий рекордсмен не просто вдвое мощнее ближайшего преследователя, но полностью китайский, вплоть до использования оригинальных 260-ядерных процессоров. И таких процессоров в китайском суперкомпьютере — больше 40 тысяч. Стоило все это 270 миллионов долларов.
Третье место — у американцев. Национальная лаборатория в Оук-Ридж владеет машиной производительностью в 17,5 петафлопса. Что же касается России, то публичных петафлопсных суперкомпьютеров есть три. Самый новый запустили в конце апреля этого года в Санкт-Петербургском политехническом университете. Это не самая производительная система в мире, но одна из самых энергоэффективных. Говорят — благодаря жидкостному охлаждению, причем отечественной разработки.
***
Компьютер научился читать по губам. Точность распознавания – почти 100 процентов. Для сравнения – специально обученные люди не дотягивают и до 50 процентов.
Столь внушительных результатов удалось достичь при помощи технологий машинного обучения. Вернее, одного из самых распространенных на данный момент его подвидов – нейронных сетей. Ученые из Оксфорда создали и обучили алгоритм LipNet. При этом используется подход, который часто задействуют при распознавании речи.
Стоит оговориться, что результат достигнут на специальной выборке в лабораторных условиях. Люди сидели неподвижно, не крутили головой, постоянно находясь в кадре. По-видимому, на данном этапе работа алгоритма в полевых условиях даст не столь хороший результат.
Первое очевидное применение данной технологии – встраивание алгоритмов LipNet в специальные приборы для слабослышащих людей. Конструктивно это может быть выполнено в виде специальных очков наподобие Google Glass. На поверхности лежит и целый спектр «шпионских» сценариев.
Последнее, вкупе с недавно анонсированной технологией распознавания лиц, о которой рассказывала наша программа, даст в будущем (возможно, не очень отдаленном) в руки правоохранительных органов универсальный инструмент для слежения за преступниками.
Интересно, что компьютерные алгоритмы помогают решить и обратную проблему – синтез человеческой речи. И хотя подобные программы – вокодеры – известны давно, компания Adobe, на днях представившая свой аудиоредактор VoCo, может совершить революцию в этой области. Программу уже называют «Photoshop для аудио». Все, что нужно, – «скормить» программе 20-минутный фрагмент записи голоса того или иного человека. После чего VoCo может озвучить любой текст. Такая программа может быть полезна звукорежиссерам – редактировать неправильно сказанные слова и фразы. Из более фантастических сценариев — актеры вообще будут избавлены от необходимости озвучивать фильмы.