Шпаргалка по зарубежному семантическому веб-поиску

О семантическом поиске активно говорят уже на протяжении нескольких последних лет. Любая технология, которая сможет улучшить уже стандартный поиск от Google, справедливо вызывает всеобщий интерес. Особенно если речь идет о долгожданной и часто обсуждаемой возможности семантического поиска – ведь количество информации в Сети стремительно нарастает, а возможности классических поисковых механизмов достигли своего технического предела.
Оцените:


Сегодня в нашем обзоре - ведущие семантические поисковые системы, и хотя многие из них пока уступают в каких-то аспектах классическому поиску Google, свои специфические преимущества перед поисковым лидером у них, вне сомнения, есть уже сегодня. Тем более, что многие традиционные поисковые гиганты активно поглощают подобные компании, как пример можно привести приобретение одного из лидеров Powerset, который с 2008 года принадлежит компании Microsoft, а его технологии интегрированы в поисковый механизм Bing.



Hakia






[caption id="attachment_17910" align="aligncenter" width="585" caption="щелкните для увеличения"][/caption]

Hakia – это семантический поиск общего назначения, который считается одним из технологических лидеров данного поискового рынка. Hakia – это очень универсальный и “всеядный” семантический поисковик, который являет собой яркую противоположность таким известным семантическим поисковикам, как Powerset и Cognition (которые мы рассмотрим далее), которые отлично ищут лишь в хорошо структурированном тексте, имеющем заведомо четкую структуру (очень типичный пример подобного ресурса – Wikipedia).
Поисковые результаты Hakia представляются в трех закладках: веб-ресурсы, заслуживающие доверия сайты (как правило официальные, государственные, образовательные и крупные новостные сайты), а также изображения и новости. В закладке Доверенные сайты можно видеть выдачу лишь тех сайтов или источников, которые были внесены в поиск вручную, вручную проверены и одобрены специальной командой “библиотекарей” поисковика.
Для некоторых запросов (обычно это популярные запросы) Hakia предоставляет кроме самой поисковой выдачи уже готовое резюме по данном запросу, где содержатся проверенные информативные и высококачественные ссылки на статьи и ресурсы по заданной теме, а также краткая суть вопроса, чтобы человек получал краткую справочную информацию не покидая самого поиска Hakia. Статистика использования Hakia показывает, что тематические резюме - одни из самых востребованных возможностей данного поискового проекта, их используют как стартовую карту для погружения в тематический вопрос, предпочитая их традиционной машинной выдачи результатов поиска.



Sensebot






[caption id="attachment_17911" align="aligncenter" width="585" caption="щелкните для увеличения"][/caption]

“Sensebot ищет вместе с вами” – таков недавний лозунг этой поисковой машины. Каждая поисковая выдача тщательно анализируется и делается попытка, с одной стороны, группировки похожих или идентичных пунктов поиска, с другой стороны – максимально ясно и четко суммировать содержание каждой из выделенных таким образом тематических групп результирующего поиска (концепция так называемого смыслового фолдинга). Таким образом, Sensebot помогает вам пробираться через массивы данных любого объема, легко находя в них именно те детали, которые интересовали вас.

Упомянутое выше краткое содержание может настраиваться и представляться в разных видах. По умолчанию, это своего рода дайджест из содержимого сформированной смысловой группы, где приводятся самый важные и релевантные факты из найденного материала. Также этот дайджест-блок может содержать облако тэгов по теме, а также список предложений, которые выражают самые главные идеи данного смыслового блока. Предложения, как и тэги, в виде ссылки ведут на конкретные страницы или список страниц иерархически связанных с данным понятием.



Cognition






[caption id="attachment_17912" align="aligncenter" width="585" caption="щелкните для увеличения"][/caption]

Это поисковый семантический движок базирующийся на лингвистической карте английского языка. Этот движок создавался на протяжении последних 24 лет и на данный момент компания, владеющая этим поисковиком утверждает, что ими составлена наиболее точная в мире карта английского языка и его смыслового пространства. Возможности Cognition не ограничиваются только предоставлением публичного семантического поиска, его ресурсы также используются множеством сторонних фирм для создания своих специализированных поисков, различной бизнес-аналитики, встроенных сервисов машинных переводов, поиску по контексту и много другого

Перечислим направления, в которых семантический поиск Cognition лидирует уже сегодня:
  • поиск по законодательству, как международному, так и сугубо американскому, юридические консультации. Как пример, у Cognition накоплена база окружных решений американских судов, начиная с 1950 года;

  • система MEDLINE (Medical Literature Analysis and Retrieval System Online) – один из лучших поисковых индексов в мире по медицинской и научной литературе вообще, различным научным данным. Только в собственной базе на эту тему хранится более 20 миллионов оригинальных документов;

  • лучший возможный поиск по английской версии Wikipedia – единая смысловая карта понятий и логических значений наложена поверх всем привычной Wikipedia, добавляя дополнительной измерение в пространство этой популярной энциклопедии;

  • собственная полнотекстовая база Нового Завета, с примечаниями переводчиков, параллельными текстами исторических оригиналов, историческими контекстными комментариями, исчерпывающей картой перекрестных ссылок внутри текстов, единой семантической картой всего материала.



  • DeepDyve






    [caption id="attachment_17913" align="aligncenter" width="585" caption="щелкните для увеличения"][/caption]

    DeepDyve – это профессиональный исследовательский инструмент, предоставляемый бесплатно для публичного использования в некоммерческих целях. Этот поисковик, как это уже видно на его названия, специализируется на индексировании так называемого “глубокого веба”, т.е. той части веб-ресурсов, которая обычно недоступна обычным поисковым машинам. Например, Google не индексирует текстовое написание ссылки (без образования гиперссылки) вида “some.ru/somedir”, DeepDyve выделяет подобные ссылки из текста и пытается учесть этот ресурс. Второй пример - для DeepDyve достаточно встретить одну ссылку на любую ветку нового для него форума, чтобы он самостоятельно попытался определить тип форумного движка и сгенерировать ссылки на другие ветки этого форума, а также его главные индексные страницы. Специальная команда добровольцев ежедневно регистрируется на сотне новых популярных форумов, предоставляя возможность движку DeepDyve заходить на них авторизованным и видеть любой скрытый для публичного наблюдателя текст. DeepDyve также свободно индексирует содержимое SQL-баз данных, как и обычных веб-страниц, если ему становятся как либо известны параметры доступа к ним.



    WolframAlpha






    [caption id="attachment_17914" align="aligncenter" width="585" caption="щелкните для увеличения"][/caption]

    Под конец нашего обзора хотелось бы упомянуть сравнительно молодую поисковую систему WolframAlpha, где главным отличием от того же Google является то, что этот поиск сам генерирует ответы на запросы пользователей. В итоге пользователь не просто работает с индексной базой поисковика, доставая при помощи запросов те или иные данные, а буквально общается с системой. WolframAlpha относится к последнему поколению семантических поисковиков, где влияние элементов искусственного интеллекта наиболее существенно, где многие из реализованных передовых концепций представляют из себя научный эксперимент, который что называется проходит проверку прямо на реальных пользователях системы. Как утверждает сам поисковик, для реализации этой системы пришлось разработать новую науку - A New Kind of Science (NKS), которая является надстройкой над привычными принципами математики.

    Некоторые подобные системы находятся ещё в своем зачаточном состоянии, например, российские семантические поисковики, такие как AskNet, поэтому мы привели только наиболее известные и зрелые на поисковом рынке. Семантический поиск – это, безусловно, технология будущего, поставившая перед собой на данный момент слишком амбициозные цели. И хотя на данный момент семантический поиск не может полностью заменить собой Google и предоставить более качественные результаты поиска, правда все же заключается в том, что семантический поиск уже сегодня позволяет эффективно решать многие нестандартные и специализированные поисковые задачи, получать ответы на сложные, логически изощренные запросы.
    Оцените:

    Комментарии Facebook

    Комментарии ВКонтакте