Поисковые таксономии и поисковые машины: ответы на вопросы против ссылок на веб-страницы | Контекстная реклама: Бегун, Директ и Adsense. Поисковая оптимизация - SEO.
Блог о контекстной рекламе. Бегун, Директ и AdSense - как заработать вебмастеру.

Поисковые таксономии и поисковые машины: ответы на вопросы против ссылок на веб-страницы 17 Ноябрь 2021

Если бы вы искали в Google, Yahoo или Bing [Ronald Reagan Movies] (Рональд Рейган фильмы), ожидали бы вы увидеть в результатах поиска список ролей в фильмах бывшего президента США и актера Рональда Рейгана?

Скорее всего, вы бы увидели набор страниц, содержащих слова “Ronald“, “Reagan” и “Movies“. Возможно, на некоторых страницах и был бы список фильмов, в которых играл Рейган.

Заявка на патент компании Yahoo, опубликованная на прошлой неделе, рассматривает способы выдачи информации напрямую ищущему человеку, основанные на построении таксономий информации о конкретных людях, местах и вещах, собранной с отдельных проиндексированных веб-страниц. Это позволит значительно сэкономить время пользователей, задающих в поисковых машинах запросы вроде “Ronald Reagan movies“.

Сейчас и Yahoo и Google иногда отвечают на вопросы, поставленные в поисковом запросе, если речь идет об определенных “именованных логических объектах”, именах известных людей, местах и вещах. Например, поиск в обеих поисковых машинах по запросу [Babe Ruth birthplace] (место рождения Бейб Рута) выдает над обычными ссылками с результатами поиска еще и ответ на поставленный вопрос.

Но ни одна из упомянутых поисковых машин не предоставляет более детальных наборов информации, таких как списки цитат определенных людей, фильмы, в которых они играли, или политические должности, которые они занимали. Но, может быть, именно это хотели бы видеть пользователи в поисковых результатах? Недавно опубликованный патент Yahoo рассматривает возможные способы построения таксономий информации о ком-то вроде Рональда Рейгана и извлечения информации из веб-страниц для построения ответов на вопросы в поисковых запросах.

Патент

Создание и обогащение таксономии, базирующейся на поиске, для нахождения информации в полуструктурированных данных

Изобретатели: Sudharsan Vasudevan, Rohan Monga, Hemanth Sambrani, N S Sekar

US Patent Application 20210282010

Принадлежит Yahoo!

Опубликовано 12 ноября 2021

Подано на рассмотрение 18 июня 2020

Аннотация

Предоставлены техники для создания и обновления иерархии логических объектов (таксономии), базирующейся на информации, полученной при взаимодействии пользователей с системой. Также предоставлены техники использования таксономии для определения природы логических объектов, представляемых терминами, введенными в поисковую машину. Поисковые логи анализируются на предмет связанных наборов логических объектов и используются для улучшения таксономии сохраняемой информации.

Когда таксономия создана, на ее основе происходит забор информации из источников данных. При получении системой запроса, этот запрос преобразуется по одному из определенных заранее шаблонов и в ответ выдается наиболее подходящий результат. Для улучшения таксономии и данных о логических объектах предоставляется механизм обратной связи. Эта система позволяет поисковым машинам давать точные ответы в случае использования логических объектов, их атрибутов и взаимоотношений.

Одним из примеров авторы патента приводят Рональда Рейгана, так как он может быть отнесен более чем к одной категории в таксономии или системе классификации. Он вошел в историю как актер и как политик. В категории “актеры” могут быть такие атрибуты как “дата рождения” и “фильмы, в которых играл”. В категории “политики” также может быть “дата рождения”, но могут быть включены и другие атрибуты, такие как “политические должности”.

Что интересно, эта система чем-то напоминает структуру каталога, с которого начинал свое развитие сервис Yahoo.

В патенте указывается на то, что Yahoo будет строить таксономии с использованием комбинации обратной связи от логов поисковых запросов и ручного вмешательства людей (редакторов). Человеческое вмешательство в построение таксономии поможет удостовериться в корректности информации, а автоматически собираемые из логов данные поисковых запросов позволят убедиться в том, что таксономия соответствует текущему положению дел и включает в себя наиболее свежую информацию.

Многие примеры, приведенные в патенте, включают в себя известных людей, места или вещи, часто называемые “именованными логическими объектами”. Среди них есть Джонни Депп и Эмпайр Стейт Билдинг. Но в то же время патент указывает на то, что могут использоваться и более широкие или специфичные категории, не включающие в себя именованные логические объекты, от “люди” до “учителя 11 классов”.

Для многих таксономий, которые подобная система может создать, отправной точкой для поисковой машины могут стать существующие источники данных вроде Internet Movie Database (База Данных Фильмов в Интернет, не упомянута напрямую в патенте) или каталоги желтых страниц.

Когда дело касается определенных типов категорий, вроде тех, что могут включать списки людей, могут быть использованы атрибуты, определяемые редакторами вручную. Например, “дата рождения”, “место рождения” или “дата смерти”.

Другие атрибуты, применимые к категориям, могут быть получены при анализе логов поисковых запросов. В качестве примера можно привести то, что люди часто ищут цитаты кого-то вроде “Марка Твена”. Если подобные поисковые запросы встречаются часто, то для поисковой машины вполне логично было бы собрать цитаты Марка Твена и выдавать их по запросу [mark twain quotes] (цитаты марка твена).

Многие люди, места и свойства имеют распространенное альтернативное название. Например, когда вы ищете чью-либо дату рождения, то вы можете использовать слова “birthday“(день рождения), “born” (родился) или “d.o.b” (д.р.). Когда кто-то ищет информацию о Джонни Деппе, то они могут проводить поиск по словам “Johnny D.”, “J. Depp” и “Jack Sparrow” (Джек Воробей). При поиске информации о Соединенных Штатах могут использоваться также “US“, “USA” или “United States of America“. Поисковая машина может научиться связывать эти альтернативные названия автоматически при помощи логов поиска.

Источники для категорий и свойств, которые будут показаны пользователям, могут определяться как редакторами, так и информацией о переходах пользователей по поисковым результатам, которую можно найти в логах поисковой машины. Некоторым источникам может быть присвоен более высокий “уровень доверия”, но в патенте не указываются свойства, по которым определяются подобные уровни. Предположительно, если конкретная веб-страница использовалась для предоставления информации и ответов на запросы, поисковая машина поставит ссылку на эту страницу, как показано выше в примере про место рождения Бейб Рута.

Выводы

В патенте более детально рассмотрены способы построения таксономий и принятия решений о показе информации в ответ на различные типы запросов.

Определенно, патент заслуживает внимательного изучения, но наиболее интересным выводом можно считать желание предоставления прямого ответа на вопросы, сформулированные в запросах к поисковой машине, вместо ссылок на страницы, которые могут и не содержать искомых ответов. Конечно, поисковые машины будут продолжать показывать ссылки на веб-страницы, являющиеся поисковыми результатами, но после отображения ответа на вопрос.

С позиции пользователя, насколько вы были бы уверены в ответах, предоставленных поисковой машиной?

С позиции вебмастера, как бы вы отнеслись к такому нововведению, ведь потенциально это означает возможность того, что поисковая машина возьмет ответ с вашего сайта и выдаст его напрямую пользователю, тем самым уничтожив необходимость перехода на ваш ресурс?

Переводной материал, источник

Рекомендую к прочтению:

Как поисковая машина может изменять рейтинг
Как поисковые машины могут расшифровывать аббревиатуры в запросах

Google получили патент на Trust Rank
Сегментация веб-страниц в Yahoo: Отделение шума от информации
Патент Google о подсказках и аннотации к ссылке.
Как поисковая машина может различать запросы от ботов и людей

Как поисковые машины могут ранжировать пользовательский контент

Комментарии»

комментариев нет - будете первым?


👩‍⚕️ рулетка видеочат онлайн