вернуться на основной сайт

Новый алгоритм “Королев”: как “Яндекс” обучает искусственный интеллект

Новый поисковый алгоритм “Королев”, анонсированный компанией “Яндекс” — еще один шаг вперед на пути к пониманию сложных пользовательских запросов и страниц, предлагающих предельно точный ответ. Искусственный интеллект прошел еще одну стадию обучения. Поисковая статистика — не единственные данные, которые учитывали специалисты. К ним присоединилась целая сеть толокеров и ассесоров. Большой вклад в “образовательный процесс” внесли и сами пользователи, которые выполняли определенные задачи и ставили свои оценки.

“Королев” не похож на предшественника: алгоритма “Палех” с его “длинным хвостом” из редко встречающихся низкочастотных запросов и нейронными сетями. Разбираемся, что изменится с выходом новой версии поиска и чем она отличается от предыдущей.

“Королев” и “Палех”: отличия

По данным “Яндекс”, ежедневно в поисковую строку вводится около 300 миллионов запросов, которые система старается удовлетворить. Часть из них — более миллиона — редкие и уникальные (возможно, они никогда больше не повторятся). Вместе такие вопросы выстраиваются в длинную цепочку, названную “хвостом”. Не такое большое количество распространенных запросов объединяется в “клюв” Жар-птицы, известной всем из русской народной сказки. Среднечастотные — это “туловище”. Получается достаточно интересный график распределения, ставший основой работы системы почти на год. “Палех”, представляющий собой поисковую модель с нейронными сетями, позволил “Яндексу” угадывать желания пользователей, сопоставлять страницы по смыслу и показывать им те, что могут максимально полно ответить на вопрос. Разговоры об отличиях алгоритмов неизбежно приводят нас к заголовкам веб-страниц. Именно они при ранжировании в первую очередь учитывались поисковиком.

Новый алгоритм “Королев” также демонстрирует свои способности благодаря использованию нейронных сетей. Но отличие состоит в том, что теперь анализируется не только заголовок, а вся страница. “Яндекс” сможет ответить на самые сложные вопросы. Например, система поймет, о чем вы думали, когда вводили в строку поиска “картина где часы плывут”, и покажет изображения одного из шедевров Сальвадора Дали. Как это происходит?

“Королев”: особенности алгоритма

Поиск по смыслу, в котором участвуют уже несколько раз упомянутые нейросети, выстраивается по определенной схеме. Суть страницы определяется еще на стадии индексирования. Причем теперь Яндекс без особых усилий, то есть в один момент, может сопоставлять запрос и смысл 200 000 документов (ранее — всего 150). Важное дополнение: при анализе документа система учитывает и смысл других пользовательских вопросов, на которые конкретная страница может ответить. Толчком стала гипотеза о том,  что в коротком перечне страниц, релевантных по каждому слову из составного запроса (в составе несколько слов), найдется страница, которая будет релевантна всем словам из поисковой фразы одновременно. Это значит, что для всех отдельных слов и часто вводимых словосочетаний Яндекс формирует индекс. В него входит перечень документов с их первоначальной релевантностью вписанному в строку вопросу. То, что раньше происходило на стадии L0, теперь происходит в процессе индексирования.

Алгоритм “Королев” учитывает полноту поиска и то, что пользователи не любят ждать. Им нужна информация прямо здесь и в ту же секунду. Чтобы максимально соответствовать пожеланиям пользователя, машина обходит сразу все страницы, попавшие в индекс, заранее в режиме offline.

Так, новый алгоритм Яндекс “Королев” можно считать целым комплексом технологий, важнейшую роль в которых играет искусственный интеллект. Мы идем к тому, что машины в скором будущем будут определять смысл целой страницы и его соответствие определенной поисковой фразе на уровне человека.

Андрей Гусаров:

“Смысловая связь запрос-документ будет еще сильней. Бум на контент-маркетинг примет совсем другие масштабы, что приведет к увеличению средней длинны документов в топе. Важную роль для ранжирования будут играть осмысленные разделы «вопрос-ответ» и другие информационные группы. Писать контент для решения задач потенциальных клиентов будет более благодарным занятием”.

Алгоритм повлияет качество контента, которое, несомненно, нужно повышать, продвижение сайтов, его принципы и стратегии.

6 queries in 1,081 seconds.