Определение релевантности по связанным запросам. Часть 1. 25 Июль 2021
Знаете ли вы, что поисковики могут пытаться убедиться в релевантности собственной выдачи? Как именно они могут это делать можно узнать из недавно одобренного патента Yahoo.
Прежде, чем перейти к описанию автоматической проверки релевантности и вариативности (распределения результатов по значениям в случае многозначного запроса), в патенте описываются недостатки ручной проверки и определения релевантности на основе данных о переходах.
Ручная проверка релевантности
Одним из вариантов проверки релевантности результатов поиска является проверка человекам результатов по каждому запросу. Это занимает довольно много времени, существует вероятность человеческой ошибки, а покрыть проверкой все запросы, встречающиеся в сети просто невозможно.
Даже сейчас можно найти объявления о вакансиях «Internet Judges». В частности, такие объявления размещала компания Lionbridge Technologies, с которой ранее сотрудничали Google. Да, поисковые машины используют ручную проверку и систему «интернет судей». Людьми являются и футбольные судьи. Они никогда не ошибаются, правда?
Отслеживание переходов
В одном из патентов Yahoo описывается система ранжирования изображений, основанная на кликах по ним пользователей. Предполагается, что по релевантным запросу изображениям пользователь кликнет и перейдет на интересующую его страницу. Следовательно, в выдаче по запросу картинки, по которым чаще кликали, подымались, а те, которые «незаслуженно» занимали высокие места, постепенно опускались вниз.
Что ж, с картинками, где существует предварительный просмотр, эта система вполне может работать эффективно. А что насчет текстовых страниц? Проблема в том, что люди видят в выдаче лишь заголовок страницы, краткую аннотацию и адрес страницы. Эти данные не обязательно адекватно представляют содержание страницы. Следовательно, даже переход по ссылке не гарантирует релевантность страницы в выдаче.
Алгоритм для определения релевантности и вариативности поисковых результатов
Процесс, запатентованный Yahoo, использует информацию недавних поисков для определения сочетаемости результатов поиска с текущим запросом.
Автоматическая проверка релевантности и вариативности для веб и вертикальных поисковых машин
Изобретено Jignashu G. Parikh
Принадлежит Yahoo
US Patent 7,558,787
Одобрено 7 июля, 2021
Подано на рассмотрение 5 июля, 2006
Аннотация
Представлена техника автоматической проверки релевантности и вариативности поисковых результатов.
Поисковой машине направляется запрос, на основании которого при помощи поискового алгоритма машина выдает поисковые результаты. Определяется набор топовых и связанных терминов для запроса. Для каждого связанного термина определяется его частота относительно остальных терминов в наборе. Если термин не встречается ни в одном из результатов, то случилась потеря в вариативности пропорциональная относительной частоте связанного термина.
Иначе, релевантность поисковых результатов вычисляется сравнением пропорции результатов содержащих термин с относительной частотой термина. Этот процесс повторяется для всех терминов в наборе или связанных терминов для того, чтобы получить полную картину релевантности и вариативности результатов.
Когда кто-то производит поиск в поисковой машине, они вводят запрос в соответствующее поле и нажимают кнопку ввода.
Поисковая машина выдает набор результатов, ранжированных согласно поисковому алгоритму. Алгоритм, используемый для ранжирования этих результатов, обычно включает в себя элементы измеряющие релевантность и важность страниц соответствующих искомому запросу.
Этот патент описывает интерфейс тестирования, который поисковые алгоритмы и разработчики поисковых машин смогут использовать для проверки вариативности и релевантности поисковых результатов.
Продолжение следует …
Рекомендую прочитать:
Как поисковые машины формируют подсказки для поиска. Часть 1.
Как поисковые машины формируют подсказки для поиска. Часть 2.
Позиции в Google и CTR – как клики распределяются по позициям
Автоматическая сегментация страниц, польза для дизайна и SEO. Часть 1.
Автоматическая сегментация страниц, польза для дизайна и SEO. Часть 2.
Консолидация ссылок и передача PageRank
- Рубрики : SEO, Патенты, Переводы, Поисковые системы
- Автор : admin
Комментарии»
комментариев нет - будете первым?