Новая технология поможет выявлять концепцию запроса и находить связанные с ним термины

09:25 30.03.2009   |   1485 |  Хуан Карлос Перес |

Рубрика Технологии



Компания Google интегрировала в свою поисковую систему технологию семантического поиска. Этот шаг позволит лидеру рынка еще немного приблизить будущее поиска в Internet, каким его видят некоторые аналитики.

Новая технология поможет поисковому механизму Google выявлять концепцию запроса и находить связанные с ним термины. А уточнение списка связанных терминов в свою очередь положительно отражается на выдаваемых поисковым механизмом результатах.

"Если, скажем, в поисковом запросе присутствует словосочетание 'физические принципы', наши алгоритмы включают в список связанные термины, которые призваны помочь вам найти то, что нужно, например такие: 'момент импульса', 'специальная теория относительности', 'теория большого взрыва' и 'квантовая механика'", -- говорится в блоге, обновляемом двумя техническими специалистами Google.

Последнее время Google все чаще подвергают критике за использование устаревшего подхода к обработке поисковых запросов, основанного на анализе ключевых слов, а не на распознавании их значения.

Однако, похоже, в Google признали важность применения семантической технологии в поисковых механизмах будущего, уточнив, впрочем, что семантические функции будут являться лишь составной частью общего алгоритма и их применение отнюдь не отменяет традиционного анализа ключевых слов.

"Наша компания действительно делает ставку на ключевые слова, но мы думаем, что со временем поисковый механизм избавится от этого ограничения, -- отмечала вице-президент Google по вопросам поисковых продуктов и обратной связи с пользователями Марисса Мейер в интервью, данном службе новостей IDG в октябре 2007 года. -- Пользователи должны иметь возможность задавать вопросы, а нам нужно понимать их смысл, ведь человеку свойственно мыслить на концептуальном уровне. И многие полагают, что возможным решением данной задачи является переход к Web-технологиям семантического анализа.

Вместе с тем Google, анализируя огромные объемы обработанной поисковой информации, уже сегодня предлагает контекстный поиск с использованием аббревиатур. Мне кажется, что наилучший поисковый алгоритм должен сочетать принципы 'грубой вычислительной силы' и глубокого понимания, а также учитывать человеческий фактор, который тоже так или иначе сказывается на составлении запроса".

В январе, в ходе селекторного совещания, посвященного обсуждению результатов четвертого квартала, генеральный директор Google Эрик Шмидт кратко коснулся темы Semantic Web, намекнув, что компании стоит более серьезно задуматься об этом. "Разве не в том наша цель, чтобы поисковый механизм распознавал смысл всей фразы, а не только входящих в нее слов? -- заметил он. -- Причем в данной области нами уже сделано довольно много открытий, обещающих принести неплохие результаты".

Многие конкуренты Google также активно работают над совершенствованием механизмов семантического поиска, обещая пользователям главное преимущество данной технологии: возможность формулирования запросов на естественном языке с последующим распознаванием поисковым механизмом их смысла.

В прошлом году Microsoft приобрела компанию Powerset, получив в свое распоряжение ее технологию семантического поиска. Компания Yahoo в прошлом году анонсировала планы поддержки ряда спецификаций Semantic Web. Среди других компаний, использующих семантический анализ в своих поисковых механизмах, следует упомянуть Ask.com и Hakia.

Сегодня Google уже оснастила свой поисковик целым рядом расширений. Из них можно отметить выдачу длинных "фрагментов" -- текстовых выдержек из содержимого сайтов, которые включают в себя ключевые слова и отражают результаты поиска.

Правда, критики утверждали, что такие выдержки не очень-то полезны, поскольку зачастую не предоставляют пользователям достаточного объема информации для принятия решения о переходе на тот или иной сайт. В настоящее время, когда люди указывают в запросах три и более ключевых слов, механизм Google выдает длинные фрагменты, позволяющие пользователям лучше понять характер использования ключевых слов на Web-сайтах.

Осталось лишь оценить реакцию владельцев сайтов на публикацию столь длинных фрагментов. В прошлом некоторые уже жаловались на то, что поисковые механизмы отражают на экране слишком большую часть их контента, в результате потенциальные посетители сайтов отказывались от перехода по ссылкам, поскольку и так уже получали всю необходимую информацию.

Здесь-то и проходит та тонкая грань между предоставлением поисковыми механизмами пользователям информации, в наибольшей степени соответствующей их запросам, и нарушением авторских прав владельцев сайтов.


Теги: