Глaвныe сoбытия и aнoнсы бoльшoй eжeгoднoй кoнфeрeнции «Яндeкс»: искусствeнный интеллект в качестве поэта-песенника, распознавание автомобилей по фотографиям и сращивание виртуального шоппинга с реальным, по крайней мере, с точки зрения таргетирования рекламы.
«Яндекс» на своей ежегодной конференции YaCM представил новый сервис под названием «Аудитории». Суть его в следующем: большинство относительно крупных компаний продают свои товары и услуги как в Интернете, так и в обычных физических магазинах, и данные об этих покупках в Интернет не попадают, а значит, и в контекстной рекламе не участвуют. Проект «Яндекс.Аудитории» позволит оффлайн-магазинам эти данные собирать и предоставлять «Яндексу». Он, в свою очередь, интегрирует их в свою систему контекстной рекламы «Директ». Таким образом, имея данные, которые получают продавцы в ходе анкетирования клиентов, «Яндекс» донесет до них рекламные объявления, которые, как ожидается, будут наиболее эффективными.
При этом, правда, немедленно встает вопрос законности и этики. Дело в том, что «Яндекс» намерен собирать, в том числе, и мобильные телефоны пользователей. Это позволит гораздо более точно их классифицировать: в отличие от адресов электронной почты, мобильный телефон у пользователя, как правило, один, поэтому информация о действиях, которые он под своим телефонным номером совершает в Интернете, будет наиболее достоверной.
Здесь, конечно, как справедливо заметила аудитория YaCM, попахивает слежкой. Был задан вопрос: «Что, если, например, коллекторская контора использует свою базу данных, чтобы засыпать «клиента» напоминаниями о долгах?» Впрочем, в «Яндекс» ответили, что эти данные и так уже активно используются другими интернет-компаниями. На западе крупнейшие подобные базы данных – у Facebook и Google. На российском рынке самый большой игрок на рынке пользовательских данных — Mail.ru, который владеет всеми российскими соцетями, и «Яндекс» стремится его догнать. Ну а что касается использования данных, то от чего не защитит закон, должна защитить яндексовская корпоративная этика.
Руководитель отдела рекламных технологий «Яндекс» Евгений Ломизе поясняет: «У нас есть представление, что реально ранит людей. Например, поведенческие факторы в любой медицинской рекламе категорически запрещены. Мы знаем, что пользователь посещал какой-то медицинский сайт или задавал какие-то медицинские запросы. И, вообще-то говоря, казалось бы, очень хорошо ему в этот момент по этим запросам подсказать лекарство. Так вот это то, чего мы никогда не делаем. «Яндекс», вообще-то говоря, на данный момент данных никому не передает. Мы все используем внутри себя, мы считаем данные большой ценностью. Мы специально заботимся, чтоб никто не мог считать эти данные. Мы запрещаем, например, мониторинг нашей рекламы пикселями, потому что это способ считать что-то».
При этом возможности системы потенциально огромны. При составлении базы данных «Яндекс.Аудитории» будет учитывать, помимо запросов пользователя в Интернете, его пол, возраст, геолокации, а также тип устройства, с которого он выходит в Сеть. Все собранные данные будут анализироваться нейронной сетью «Яндекс», и из похожих или даже одинаковых пользователей будут формироваться таргет-группы. Эту информацию «Яндекс» сможет передавать своим рекламным партнерам.
Еще одна новость от «Яндекс» оказалась скорее побочным продуктом, однако он также довольно интересен с точки зрения использования искусственного интеллекта. Главный аналитик «Яндекс» Иван Ямщиков совместно с руководителем поисковой аналитики Алексеем Тихоновым с помощью нейросети почти воскресили творчество культовой перестроечной панк-группы «Гражданская оборона». Для этого они использовали так называемого «нейропоэта». Он состоит из двух частей: во-первых, это нейросеть, которую заставили проанализировать творчество десятков русских поэтов, в том числе, лидера «Гражданки» Егора Летова; во-вторых, это алгоритм, который ранее занимался тем, что составлял стихотворения из поисковых запросов, введенных живыми пользователями. Получился симбиоз: нейросеть генерирует строки в стиле Егора Летова, а алгоритм их рифмует.
Почему был выбран именно Летов? Помимо того, что он очень нравится самим авторам проекта, есть и гораздо более приземленная причина. «Если мы выбираем автора, который не склонен писать повествовательные тексты, а склонен просто брать кучу образов и делать из них стихотворение, то у нас очень хорошо все получается. Ну, по крайней мере, нам кажется, что получается неплохо. Потому что набор образов нейросеть генерирует хорошо. Связывать эти образы в какую-то канву повествования — это пока следующий шаг, который мы не сделали. Это Летов, это Хармс, это очень много поэтов русского рока», — говорит Иван Ямщиков. Кстати, для создания аутентичного звука «Гражданки» пришлось немного расстроить гитары, а также записать треки на кассету, которую уже после оцифровать.
И, наконец, еще одна премьера «Яндекса». В мобильном приложении портала Auto.ru, который принадлежит «Яндекс», заработал поиск машины по фотографии. То есть, пользователь может просто сфотографировать понравившуюся ему машину, а система сама назовет марку, среднюю цену и подберет объявления. При этом точность распознавания по фотографии кузова составляет 98 процентов. А еще система умеет отличать автомобили по форме фар или даже конфигурации приборной панели. Любопытно, что то же самое тестируется и в перспективе может применяться и при подборе запчастей. Пока, правда, имеется ряд трудностей. Руководитель мобильной разработки Авто.ру Максим Чекмарев поясняет: «Чаще всего запчасти — это бесформенные металлические штуки черного и серого цвета. Обучить на запчастях будет сложно, но, конечно, это такой большой челлендж, который мы попробуем в будущем».
Пока же алгоритм распознает только легковые автомобили и, в теории, мотоциклы. Впрочем, эту функцию нам подтвердить не удалось: при попытке сфотографировать мопед приложение брезгливо посмотрело сквозь него и распознало стоящий на фоне «Мерседес».