Новотека - персональная поисковая машина

Новотека"Новотека" - разработка компании "Поисковые технологии". Этот проект российским интернет-пользователям более известен как агрегатор новостей. В настоящее время проводится закрытое тестирование ещё одного сервиса – "Новотека. Персональный поиск". О нем и поговорим.
Оцените:


Современные "классические" поисковые системы имеют два существенных для меня недостатка. Во-первых, я все чаще сталкиваюсь с нерелевантностью результатов поиска. Недавно искал обзоры одной модели сотового телефона, поисковики в выдаче давали в основном ссылки на интернет-магазины.

Второе, что огорчает, — большинство поисковиков имеют довольно слабые возможности по настройке и персонализации поиска. Как правило, мы можем выбрать язык, регион, тип файлов или сайт, где необходимо найти информацию. Но в большинстве случае мы не можем заранее составить список сайтов, по которым производить поиск, и сохранить его для дальнейшего обращения в будущем.

Обе указанные проблемы тесно связаны. Было бы просто замечательно, если бы пользователи могли составлять список "доверенных" интернет-ресурсов определенной тематики, и уже по ним искать нужную информацию. Скажем, мне, как любителю кино, интересно было бы составить список сайтов с кинорецензиями (Exler.ru, Kino-Govno и парочка подобных), по которым осуществлять поиск (избежав, тем самым, ссылок, например, на интернет-магазины и дорвеи).

Подобные сервисы за рубежом существую уже давно, самый известный из них Rollyo. У нас пока такие возможности предлагает лишь "Новотека".

Как я уже сказал, "Новотека. Персональный поиск" находится в стадии закрытого тестирования. Но получить приглашение достаточно просто. Мне положительный ответ на запрос о регистрации от разработчиков пришел в течение суток.

Новотека



Как это работает



После регистрации вам надо составить список сайтов, по которым вы планируете искать информацию. Для каждого из ресурсов потребуется указать ряд данных.


  • Название. С этим все понятно. Писать можете все, что заблагорассудится.

  • Точки входа (URL). Точки входа – это страницы, с которых должна начинаться индексация содержимого сайта. Как видно на иллюстрации, для сайта "Интернетные штучки" я указал в качестве точки входа главную страницу – просто хотел, чтобы был проиндексирован весь сайт. Такой подход не всегда оправдан. Иногда может потребоваться только один раздел сайта, например, страница с обзорами. В этом случае, разумнее будет индексировать только его, а не весь сайт. Поэтому и URL стоит указывать не для всего сайта, а только для конкретного раздела. Пока в системе предусмотрена возможность указать до четырех точек входа (на случай, если вам интересны несколько разделов сайта, а не весь ресурс).

  • Квота. После того, как вы указали точки входа, "Новотека" начнет составление индекса. Чем больше сайт, тем больше потребуется дискового пространства под индекс. По умолчанию, предоставляемая квота составляет 200 Мб, но при необходимости пользователь может увеличить ее ещё на 200 Мб (и так до 1 Гб). Этого вполне достаточно для сайта среднего размера.

  • Периодичность выкачки. Довольно важный параметр. Если сайт обновляется очень часто, оперативно, то следует установить более частую периодичность выкачки страниц. Самый частый период – раз в день. Для домашних страничек можно установить более редкую выкачку (раз в месяц) или вообще не обновлять.

  • Глубина выкачки. Этот параметр отвечает за то, как далеко относительно точки входа пойдет робот в индексации контента. Если дисковая квота позволяет, можно установить максимальное значение – 7. Но, как правило, достаточно "тройки".

  • Выходить за пределы подкаталога?. Отметьте этот параметр, если хотите, чтобы индексировались страницы не только в том подкаталоге, который вы определили, но и за его пределами. Может быть полезным, если в самом каталоге мало страниц.

  • Ограничивающие и запрещающие маски. Используя ограничивающие маски, можно указать роботу "Новотеки" скачивать только те страницы, которые соответствуют маске. Запрещающие маски блокируют скачивание определенных страниц. При задании масок, пользователь использует спецсимволы — "*", "?", "\?" (без кавычек).



После того, как вы укажите эти данные, "Новотека" проиндексирует сайт (или его часть, зависит от выбора пользователя). Процедура эта небыстрая, может занять несколько часов. Когда индекс будет построен, вы сможете воспользоваться поиском.

Новотека



Полезные возможности



После создания "собственного" поисковика, пользователь при желании может сделать его общедоступным. Тогда и другие интернетчики смогут искать по выбранным вами сайтам.

Персональный поиск "Новотеки" будет интересен и многим владельцам сайтов. Веб-мастер может разместить форму поиска "Новотеки" на своем сайте. Один мой знакомый, которого не устраивает стандартный поиск в Wordpress, использует именно "Новотеку". Чтобы получить код формы, поиск надо сделать публичным.

Новотека



Резюме



Мне очень понравился персональный поиск "Новотеки" и я часто им пользуюсь. Это прежде всего удобно – искать на заранее определенных, тематически однородных сайтах, минуя спам-ресурсы и страницы с перепечатанным контентом. Так что для пользователя "Новотека" представляет большой интерес. Подобного сервиса, сравнимого по мощи и удобству, в Рунете пока нет.

А вот для владельцев сайтов "Новотека" все-таки бесполезна. Дело в том, что в выдаче результатов отображается реклама "Бегуна". А если автор не возражает против рекламы, то он скорее предпочтет "Google Adsense для поиска". Там хотя бы есть возможность заработать.

Если знаете ещё какие-либо российские сервисы персонального поиска, расскажите, пожалуйста, о них в комментариях.

Оцените:

Комментарии Facebook

Комментарии ВКонтакте