Как Google, Yahoo и Microsoft собираются перекроить поисковые механизмы

schemaСлучаи, когда конкуренты объединяются, случаются не так уж и часто, один из них – выработка стандартов. О том, как сделать свой сайт более понятным для поисковиков, расскажет schema.org – детище Google, Yahoo! и Microsoft.

Google и Microsoft – конкуренты на рынке поиска (о Yahoo тут можно не говорить, т.к. он работает на движке Bing), однако, как показывает мировой опыт, наличие стандартов всегда благотворно влияет на рынок, поэтому неудивительно, что эти гиганты решили помочь владельцам сайтов сделать их более понятными поисковым машинам, для чего создали ресурс schema.org, который содержит конкретные рекомендации по разметке страниц.

 


 


Как гласит FAQ сайта, schema.org не является официальным формальным стандартом типа W3C – это просто описание той разметки, которую воспринимают Google, Yahoo и Microsoft.


Такие вещи лучше описывать на примерах. Так, дата в разных странах может записываться и читаться по-разному. Запись вида 04/01/11 может восприниматься и как 4 января 2011 года, и как 11 января 2004 года, и как 1 апреля 2011 года. Чтобы для поисковиков не было неоднозначности в этом вопросе, Google, Microsoft и Yahoo рекомендуют записывать дату так


<time datetime="2011-04-01">04/01/11</time>


В атрибуте datetime дата всегда указывается в формате YYYY-MM-DD, что исключает неоднозначное толкование строки внутри тэга, где вообще дату можете написать словами – поисковик всё равно воспримет атрибут datetime. Стоит заметить, что, собственно говоря, ничего нового поисковики тут не предлагают - тэг time входит в стандарт HTML, однако далеко не все вебмастера про него знают, поэтому о нём на schema.org напомнили особо.


Ниже будут примеры того, что поисковики предлагают нового для разметки страниц. Современный интернет немыслим без интернет-магазинов и поисковики позаботились и о них.


Во-первых, для товаров введён тип Offer, и описание каждого товара предлагается сопровождать соответствующим itemtype.


 


 <div itemscope itemtype="http://schema.org/Offer">

 <span itemprop="name">Blend-O-Matic<


/span>

 <span itemprop="price">$19.95</span>


 <span itemprop="availability">Available today!</span>


</div>




 


При этом для указания степени доступности товара (на складе, нет на складе, только по предзаказу и др.) есть свойство availability и для точного указания доступности рекомендуется предыдущий пример писать вот так:


 


 <div itemscope itemtype="http://schema.org/Offer">

 <span itemprop="name">Blend-O-Matic<


/span>

 <span itemprop="price">$19.95</span>


 <link itemprop="availability" href="http://schema.org/InStock"/>Available today!


</div>


В данном случае http://schema.org/InStock указывает на то, что товар есть на складе. Для указания на его отсутствие нужно было бы написать http://schema.org/OutOfStock




Для описания людей введён тип Person (http://schema.org/Person), а для фильмов – Movie(http://schema.org/Movie). И если вы хотите совместить информацию о фильме с информацией о режиссёре, указав, например, его дату рождения, то и это тоже возможно. Например, вот так:


 


<div itemscope itemtype ="http://schema.org/Movie">

 <h1 itemprop="name">Avatar</h1>


 <div itemprop="director" itemscope itemtype="http://schema.org/Person">


 Director: <span itemprop="name">James Cameron</span> (born <span itemprop="birthDate">August 16, 1954)</span>


 </div>


 <span itemprop="genre">Science fiction</span>


 <a href="../movies/avatar-


theatrical-trailer.html" itemprop="trailer">Trailer</a>

</div>




 


Как видно из примера, описание режиссёра с itemtype http://schema.org/Person вложено в описание фильма с itemtype http://schema.org/Movie


Чтобы не пересказывать содержание всего schema.org, рекомендуем вам самим посетить его и ознакомиться с теми типами данных, которые поисковики предлагают использовать в разметке страниц.


main


Является ли данная инициатива первой унификацией разметки именно для поисковиков, а не для браузеров? По большому счёту, да. Из предыдущих инициатив можно вспомнить только введение атрибута nofollow у ссылок, предназначенного для борьбы со спам-ссылками. Сначала он был введён Google в 2005-м году, а с мая 2010 года его стал учитывать и Яндекс. Bing также его учитывает.


Является ли данная инициатива революционной? Тут, конечно, всё зависит от того, как поисковики будут использовать полученные из такой разметки данные. Пока что не очень понятно, как им может пригодиться знание о том, есть товар на складе или нет, особенно если учесть, что этот статус может меняться быстрее, чем поисковик сделает переиндексацию страницы с данными о товаре.


Если в будущем поисковики реализуют возможность делать отдельный поиск по фильмам, персонам или другим сущностям, то такая разметка, конечно, пригодится. Её использование ясно даст указание поисковым машинам, что речь на странице идёт, например, именно о фильме, причём именно данного режиссёра, а не другого (что важно для фильмов с одинаковыми названиями). Конечно, это сделает поиск более эффективным.


Есть ли у этого нововведения минусы? Минус может появиться только один – если вебмастера будут тратить дополнительное время на использование этой разметки, а поисковики так и не научатся корректно использовать полученные данные для формирования результатов поисковой выдачи.

Автор: danivanov 14 Jun 2011

Комментарии

 

KVA :
Эх, так и не понятно в итоге - внедрять или нет. :)
Nayjest :
имхо: Очень правильный, крутой шаг.
Так вот, не успеешь опомниться, а тут уже везде вокруг семантический web)
TecHMeaT :
Я уже несколько проектов сверстал с использованием микроданных, и если говорить о потере времени - да, час-два времени вы потеряете. Я с этим спокойно мирюсь )
mr. ringer :
Не думаю, что ПС внедрят все это в ближайшие несколько лет. Хотя с Google все может быть наоборот. Надеюсь, что эта красота все-таки будет учитываться в будущем - и пользователям польза, и веб-мастерам счастье)
psevdonim :
как же быстро web развивается и шагает вперед, ох угнаться не успеваешь просто
Николай :
Думаю в будущем поиск будет намного эффективней,чем сейчас.