Переранжировать поисковые результаты на основе тематического разделения | Контекстная реклама: Бегун, Директ и Adsense. Поисковая оптимизация - SEO.
Блог о контекстной рекламе. Бегун, Директ и AdSense - как заработать вебмастеру.

Переранжировать поисковые результаты на основе тематического разделения 24 Сентябрь 2023

Если вы ищете слово “cold1″ через форму поиска на сайте, посвященном здоровью, то, скорее всего, вы желаете найти что-то о простуде. Если же вы ищете “cold” в Google, Yahoo или Bing, то вы можете быть заинтересованы в погоде, кондиционировании воздуха, материалах о холодной войне или же простуде.

Различные сайты и страницы могут фокусироваться на различных темах вроде здоровья или спорта, или погоды, или строительства. И один из способов разобраться в словах с множественными значениями для поисковой машины – назначение тематических оценок страницам и другим элементам Сети, независимо от того, для каких запросов они являются приемлемыми результатами. При поиске же, когда запрос, по мнению машины, относится к определенной теме, выдаются страницы, связанные с соответствующей темой, на основе “тематических оценок” (domain score) этих страниц.

Зачем нужны тематические категории при ранжировании страниц?

Описательная часть патента начинается с разбора обычных методов ранжирования страниц в поисковых результатах.

Когда поисковая машина пытается сопоставить запрос с документом, то она может предпринять множество действий. Одним из этих действий может быть “лемматирование”, или же группировка различных форм слова в запросе и идентификация словарной формы слова (леммы). Затем лемма используется для определения документов, содержащих искомое ключевое слово.

Система ранжирования на основе ключевых слов также может присваивать страницам оценки в зависимости от статистики появлений ключевых слов запроса в документах, содержащих эти ключевые слова. Большое число появлений ключевого слова в документе может повысить оценку документа. Если редкое ключевое слово (которое появляется в небольшом количестве документов в Сети) одновременно содержится в запросе и документе, то это также может увеличить оценку страницы. Если в запросе содержатся ключевые слова, которых нет на странице, то ее оценка может быть понижена. Если ключевые слова появляются в определенных частях страницы, вроде заголовка, то оценка страницы может быть повышена.

В дополнение к оценке нахождения ключевого слова из запроса на странице, при ранжировании веб-страниц по ключевым словам зачастую могут использоваться и показатели популярности страницы. Эти показатели могут включать информацию о ссылках на страницы, статистику выбора и перехода на определенные страницы пользователями при поиске по выбранному запросу и т.д.

Но одним из главных ограничений подобного подхода является ситуация, когда слово в запросе имеет более одного значения, и определить конкретное значение из контекста запроса представляется затруднительным.

Рассчитывать тематическую оценку для страницы можно различными способами. Например, можно определять оценку страницы на “медицинскую” тематику по количеству медицинских терминов на указанной странице. Или же сопоставлять содержимое страницы запросу и учитывать соотношение и совпадение медицинских терминов в запросе и на странице.

Как следствие – порядок расположения ссылок на странице поисковых результатов может зависеть одновременно от традиционного способа ранжирования страниц и тематической оценки этих же страниц.

Патент:

Ранжирование на тематической основе при поиске документов

Изобретатели: Alain Thierry Rappaport, Daniel Adamson

Принадлежит Microsoft

US Patent Application 20230228743

Опубликовано: 9 сентября 2023

Подано на рассмотрение: 3 марта 2022

Отрывок

В примере документы, исследуемые поисковым процессом, могут быть оценены в соответствии с тематикой. Тематикой может быть основная область вроде медицины, спорта и т.д. К документам могут применяться различные способы оценки с учетом особенностей тематики, создавая, таким образом, оценки отличные от тех, что получились бы при простом сравнении ключевых слов в запросе и в документах.

Различные подходы к тематическому оцениванию могут учитывать при оценке запрос или не быть зависимыми от запроса. Оценщиком может быть применен каждый из подходов. Совместный вывод оценщиков может быть использован для генерации оценки каждого документа. Затем документы могут быть ранжированы в соответствии с оценками, после чего могут быть выданы поисковые результаты.

Страница может покрывать несколько тематик на нескольких уровнях. Например, страница о бейсболе может содержать множество ключевых слов и концепций, связанных с бейсболом. Другая страница может охватывать спорт в более общем плане, включая бейсбол, футбол, хоккей, гимнастику, керлинг и т.д.

Чем более обширную тему охватывает страница, тем более она будет популярна в плане входящих ссылок, посещаемости и т.д., что в обычной системе ранжирования приведет к тому, что она будет в списке поисковых результатов по запросу о бейсболе выше, чем страница, посвященная только бейсболу. Но если учесть тематические оценки этих страниц, то посвященная исключительно бейсболу страница может выйти на более высокую позицию за счет того, что у нее лучшая тематическая оценка по теме бейсбола.

Заключение

Патент описывает множество подходов, которые могут использоваться для определения концепций, представленных на странице, и ранжирования страницы на основе различных тематических областей, которые она может покрывать. Среди них могут быть и вещи вроде усиления значения ключевых слов в заголовке страницы если, по мнению поисковой машины, они указывают на тему страницы, но описаны и случаи из других областей.

Независимо от подходов, которые может использовать поисковая машина, вы можете самостоятельно проделать одно интересное упражнение. Просмотрите страницы своего сайта и определите, насколько они вписываются в тематику того, о чем на них идет речь. А если бы вам пришлось назначить страницам сайта по несколько тематик и оценить каждую из них по каждой теме?

Теперь представьте, что поисковая машина делает то же самое. Она попытается классифицировать ваши страницы на основе того, что ей известно о других страницах в сети с похожей тематикой.

Насколько близки ваши тематики с теми, которые присвоит поисковая машина?

Выбранные поисковой машиной для страницы тематики могут быть использованы впоследствии для определения того, насколько страница соответствует концепциям или темам, определенным поисковой машиной в запросе.

1 – слово “cold” в английском языке может означать как просто “холод”, так и “простуду”.

Переводной материал, источник

Комментарии»

комментариев нет - будете первым?


👩‍⚕️ рулетка видеочат онлайн
💬