Информационные технологииStfw.Ru 🔍

Раскрутка и оптимизация сайта 1

Данный курс предназначен для авторов и владельцев сайтов, желающих более подробно заняться вопросами поисковой оптимизации и раскрутки своего ресурса. tutorial.semonitor.ru
🕛 19.12.2005, 01:41
Введение
1. Общая информация о поисковых системах 1.1 История развития поисковых систем 1.2 Общие принципы работы поисковых систем
2. Внутренние факторы ранжирования 2.1 Текстовое оформление веб-страниц 2.1.1 Объем текста на странице 2.1.2 Число ключевых слов на странице 2.1.3 Плотность ключевых слов 2.1.4 Расположение ключевых слов на странице 2.1.5 Стилистическое оформление текста 2.1.6 Тег «TITLE» 2.1.7 Ключевые слова в тексте ссылок 2.1.8 Теги «ALT» изображений 2.1.9 Мета-тег Desciption 2.1.10 Мета-тег Keywords 2.2 Структура сайта 2.2.1 Число страниц сайта 2.2.2. Навигационное меню 2.2.3 Ключевое слово в названии страницы 2.2.4 Избегайте подкаталогов 2.2.5 Одна страница - одна ключевая фраза 2.2.6 Главная страница сайта 2.3 Распространенные ошибки 2.3.1 Графический заголовок 2.3.2 Графическое навигационное меню 2.3.3 Навигация через скрипты 2.3.4 Идентификатор сессии 2.3.5 Редиректы 2.3.6 Скрытый текст 2.3.7 Однопиксельные ссылки
3 Внешние факторы ранжирования 3.1 Для чего используется учет внешних ссылок на сайт 3.2 Важность ссылок (индекс цитируемости) 3.3. Ссылочный текст 3.4 Релевантность ссылающихся страниц 3.5 Google PageRank - теоретические основы 3.6 Google PageRank - практическое использование 3.7 ТИЦ и ВИЦ Яндекс 3.8 Увеличение ссылочной популярности 3.8.1 Сабмит в каталоги общего назначения 3.8.2 Каталог DMOZ 3.8.3 Каталог Яндекса 3.8.4 Обмен ссылками 3.8.5 Пресс-релизы, новостные ленты, тематические ресурсы
4 Индексация сайта
5 Подбор ключевых слов 5.1 Первоначальный выбор ключевых слов 5.2 Высокочастотники и низкочастотники 5.3 Оценка уровня конкуренции поисковых запросов 5.4 Последовательное уточнение поисковых запросов
6 Различная информация о поисковых системах 6.1 Google SandBox 6.2 Google LocalRank 6.3 Особенности работы различных поисковых систем 6.4 Советы, предположения, наблюдения 6.5 Создание правильного контента 6.6 Выбор домена и хостинга 6.7 Смена адреса сайта
7. Semonitor - пакет программ для раскрутки и оптимизации сайта 7.1 Модуль Определение позиций 7.2 Модуль внешние ссылки 7.3 Модуль Индексация сайта 7.4 Модуль Лог-Анализатор 7.5 Модуль Page Rank анализатор 7.6 Модуль Подбор ключевых слов 7.7 Модуль HTML анализатор 7.8 Программы регистрации сайтов AddSite и Add2Board
8. Полезные ресурсы
Вместо заключения - раскрутка сайта шаг за шагом



Введение Данный курс предназначен для авторов и владельцев сайтов, желающих более подробно заняться вопросами поисковой оптимизации и раскрутки своего ресурса. Рассчитан он в основном на начинающих, хотя и опытный вебмастер, надеюсь, почерпнет из него что-то новое. В Интернете можно найти большое количество статей по теме поисковой оптимизации, в данном учебнике сделана попытка объединить всю информацию в виде единого, последовательного курса.
Информацию, представленную в данном учебнике можно разбить на несколько частей: - четкие, конкретные рекомендации, практическое руководство к действию; - теоретическая информация, которой, по нашему мнению, должен обладать любой специалист в области seo; - советы, наблюдения, рекомендации, полученные на основе опыта, изучения различных материалов и т.п.

1. Общая информация о поисковых системах
1.1 История развития поисковых систем В начальный период развития Интернет, число его пользователей было невелико, а объем доступной информации относительно небольшим. В большинстве случаев доступ к Интернет имели сотрудники различных университетов и лабораторий, а в целом Сеть использовалась в научных целях. В это время задача поиска информации в сети Интернет была далеко не столько актуальной, как в настоящее время.
Одним из первых способов организации доступа к информационным ресурсам сети стало создание каталогов сайтов, в которых ссылки на ресурсы группировались согласно тематике. Первым таким проектом стал сайт Yahoo, открывшийся в апреле 1994 года. После того, как число сайтов в каталоге Yahoo значительно увеличилось, была добавлена возможность поиска информации по каталогу. Это, конечно же, не было поисковой системой в полном смысле, так как область поиска была ограничена только ресурсами, присутствующими в каталоге, а не всеми ресурсами сети Интернет.
Каталоги ссылок широко использовались ранее, но практически утратили свою популярность в настоящее время. Причина этого очень проста - даже современные каталоги, содержащие огромное количество ресурсов, представляют информацию лишь об очень малой части сети Интернет. Самый большой каталог сети DMOZ (или Open Directory Project) содержит информацию о 5 миллионах ресурсов, в то время как база поисковой системы Google состоит из более чем 8 миллиардов документов.
Первой полноценной поисковой системой стал проект WebCrawler появившийся в 1994 году.
В 1995 году появились поисковые системы Lycos и AltaVista. Последняя долгие годы была лидером в области поиска информации в Интернет.
В 1997 году Сергей Брин и Ларри Пейдж создали Google в рамках исследовательского проекта в Стэнфордском университете. В настоящий момент Google самая популярная поисковая система в мире.
23 сентября 1997 года была официально анонсирована поисковая система Yandex, самая популярная в русскоязычной части Интернет.
В настоящее время существует 3 основных международных поисковых системы - Google, Yahoo и MSN Search, имеющих собственные базы и алгоритмы поиска. Большинство остальных поисковых систем (коих можно насчитать очень много) использует в том или ином виде результаты 3 перечисленных. Например, поиск AOL (search.aol.com) и Mail.ru используют базу Google, а AltaVista, Lycos и AllTheWeb - базу Yahoo.
В России основной поисковой системой является Яндекс, за ним идут Rambler, Google.ru, Aport, Mail.ru и KM.ru.


1.2 Общие принципы работы поисковых систем Поисковая система состоит из следующих основных компонентов:
Spider (паук) - браузероподобная программа, которая скачивает веб-страницы.
Crawler (краулер, «путешествующий» паук) - программа, которая автоматически проходит по всем ссылкам, найденным на странице.
Indexer (индексатор) - программа, которая анализирует веб-страницы, скаченные пауками.
Database (база данных) - хранилище скачанных и обработанных страниц.
Search engine results engine (система выдачи результатов) - извлекает результаты поиска из базы данных.
Web server (веб-сервер) - веб-сервер, который осуществляет взаимодействие между пользователем и остальными компонентами поисковой системы.
Детальная реализация поисковых механизмов может отличаться друг от друга (например, связка Spider+Crawler+Indexer может быть выполнена в виде единой программы, которая скачивает известные веб-страницы, анализирует их и ищет по ссылкам новые ресурсы), однако всем поисковым системам присущи описанные общие черты.
Spider. Паук - это программа, которая скачивает веб-страницы тем же способом, что и браузер пользователя. Отличие состоит в том, что браузер отображает информацию, содержащуюся на странице (текстовую, графическую и т.д.), паук же не имеет никаких визуальных компонент и работает напрямую с html-текстом страницы (вы можете сделать «просмотр html-кода» в вашем браузере, чтобы увидеть «сырой» html-текст).
Crawler. Выделяет все ссылки, присутствующие на странице. Его задача - определить, куда дальше должен идти паук, основываясь на ссылках или исходя из заранее заданного списка адресов. Краулер, следуя по найденным ссылкам, осуществляет поиск новых документов, еще неизвестных поисковой системе.
Indexer. Индексатор разбирает страницу на составные части и анализирует их. Выделяются и анализируются различные элементы страницы, такие как текст, заголовки, структурные и стилевые особенности, специальные служебные html-теги и т.д. Database. База данных - это хранилище всех данных, которые поисковая система скачивает и анализирует. Иногда базу данных называют индексом поисковой системы.
Search Engine Results Engine. Система выдачи результатов занимается ранжированием страниц. Она решает, какие страницы удовлетворяют запросу пользователя, и в каком порядке они должны быть отсортированы. Это происходит согласно алгоритмам ранжирования поисковой системы. Эта информация является наиболее ценной и интересной для нас - именно с этим компонентом поисковой системы взаимодействует оптимизатор, пытаясь улучшить позиции сайта в выдаче, поэтому в дальнейшем мы подробно рассмотрим все факторы, влияющие на ранжирование результатов.
Web server. Как правило, на сервере присутствует html-страница с полем ввода, в котором пользователь может задать интересующий его поисковый термин. Веб-сервер также отвечает за выдачу результатов пользователю в виде html-страницы.

2. Внутренние факторы ранжирования Все факторы, влияющие на положение сайта в выдаче поисковой системы, можно разбить на внешние и внутренние. Внутренние факторы ранжирования - это те, которые находятся под контролем владельца веб-сайта (текст, оформление и т.д.).
2.1 Текстовое оформление веб-страниц
2.1.1 Объем текста на странице Поисковики ценят сайты, богатые информационным содержанием. В общем случае следует стремиться к увеличению текстового наполнения сайта.
Оптимальными следует считать страницы, содержащие 500-3000 слов или 2-20 кб. текста (от 2 до 20 тыс. символов).
Страница, состоящая всего лишь из нескольких предложений, имеет меньше шансов попасть в топ поисковых систем.
Кроме того, большее количество текста на странице увеличивает видимость страницы в поисковых системах за счет редких или случайных поисковых фраз, что в некоторых случаях может давать неплохой приток посетителей.

2.1.2 Число ключевых слов на странице Ключевые слова (фразы) должны встречаться в тексте как минимум 3-4 раза. Верхняя граница зависит от общего объема страницы - чем больше общий объем, тем больше повторений можно сделать.
Отдельно следует рассмотреть ситуацию с поисковыми фразами, то есть словосочетаниями из нескольких ключевых слов. Наилучшие результаты наблюдаются, если фраза встречается в тексте несколько раз именно как фраза (т.е. все слова вместе в нужном порядке), а кроме того, слова из фразы попадаются в тексте несколько раз поодиночке. Также должно существовать некоторое различие (разбалансировка) между числом вхождений каждого из слов, составляющих фразу.
Рассмотрим ситуацию на примере. Допустим, мы оптимизируем страницу под фразу «dvd проигрыватель». Хороший вариант - фраза «dvd проигрыватель» встречается в тексте 10 раз, кроме того, слово «dvd» встречается отдельно еще 7 раз, слово «проигрыватель» еще 5 раз. Все цифры в примере условны, но хорошо показывают общую идею.

2.1.3 Плотность ключевых слов Плотность ключевого слова на странице показывает относительную частоту содержания слова в тексте. Плотность измеряется в процентах. Например, если заданное слово встретилось 5 раз на странице из 100 слов, то плотность этого слова равна 5%. Слишком низкая плотность приведет к тому, что поисковая система не придаст должного значения этому слову. Слишком высокая плотность способна включить спам-фильтр поисковой системы (то есть страница будет искусственно понижена в результатах поиска из-за чрезмерно частого употребления ключевой фразы).
Оптимальной считается плотность ключевого текста 5-7%. В случае фраз, состоящих из нескольких слов, следует посчитать суммарную плотность всех ключевых слов, составляющих фразу и убедиться, что она укладывается в указанные пределы.
Практика показывает, что плотность ключевого текста более 7-8%, хотя и не ведет к каким-либо отрицательным последствиям, но и смысла особого в большинстве случаев также не имеет.

2.1.4 Расположение ключевых слов на странице Очень короткое правило - чем ближе ключевое слово или фраза к началу документа, тем больший вес они получают в глазах поисковой системы.

2.1.5 Стилистическое оформление текста Поисковые системы придают особое значение тексту, тем или иным способом выделенному на странице. Можно дать следующие рекомендации:
- используйте ключевые слова в заголовках (текст, выделенный тегами «H», в особенности «h1» и «h2»). В настоящее время использование css позволяет переопределить вид текста, выделенного этими тегами, поэтому использование тегов «H» имеет меньшее значение, чем раньше, однако, пренебрегать ими ни в коем случае не стоит; - выделяйте ключевые слова жирным шрифтом (не во всем тексте, конечно же, но сделать такое выделение 2-3 раза на странице не помешает). Для этого рекомендуется использовать тег «strong», вместо более традиционного тега «B» (bold).

2.1.6 Тег «TITLE» Один из наиболее важных тегов, которому поисковые системы придают огромное значение. Обязательно нужно использовать ключевые слова в теге TITLE.
Кроме того, ссылка на ваш сайт в выдаче поисковой системы будет содержать текст из тега TITLE, так что это, в некотором роде, визитная карточка страницы.
Именно по этой ссылке осуществляется переход посетителя поисковой системы на ваш сайт, поэтому тег TITLE должен не только содержать ключевые слова, но быть информативным и привлекательным.
Как правило, в выдачу поисковой системы попадает 50-80 символов из тега TITLE, поэтому размер заголовка желательно ограничить этой длинной.

2.1.7 Ключевые слова в тексте ссылок Также очень простое правило - используйте ключевые слова в тексте исходящих ссылок с ваших страниц (как на другие внутренние страницы вашего сайта, так и на другие ресурсы сети), это может добавить вам небольшое преимущество при ранжировании.

2.1.8 Теги «ALT» изображений Любое изображение на странице имеет специальный атрибут «альтернативный текст», который задается в теге «ALT». Этот текст будет отображен на экране в том случае, если скачать изображение не удалось или же показ изображений заблокирован в браузере.
Поисковые системы запоминают значение тега ALT при разборе (индексации) страницы, однако не используют его при ранжировании результатов поиска.
На данный момент достоверно известно, что поисковая система Google учитывает текст в теге ALT тех изображений, которые являются ссылками на другие страницы, остальные же теги ALT игнорируются. По другим поисковым систем точных данных нет, но можно предполагать что-то подобное.
В целом стоит дать такой совет - использовать ключевые слова в тегах ALT можно и нужно, хотя принципиального значения это не имеет.

2.1.9 Мета-тег Desciption Мета-тег Description специально предназначен для задания описания страницы. Этот тег никак не влияет на ранжирование, но, тем не менее, очень важен. Многие поисковые системы (и, в частности, крупнейшая Google) отображают информацию из этого тега в результатах поиска, если этот тег присутствует на странице и его содержимое соответствует содержимому страницы и поисковому запросу.
Можно с уверенностью сказать, что высокое место в результатах поиска не всегда обеспечивает большое число посетителей. Если описание ваших конкурентов в результатах выдачи будет более привлекательным, чем вашего сайта, то посетители поисковой системы выберут именно их, а не ваш ресурс.
Поэтому грамотное составление мета-тега Description имеет большое значение. Описание должно быть кратким, но информативным и привлекательным, содержать ключевые слова, характерные для данной страницы.

2.1.10 Мета-тег Keywords Этот мета-тег изначально предназначался для указания ключевых слов данной страницы. Однако в настоящее время он почти не используется поисковыми системами.
Тем не менее, стоит заполнить этот тег «на всякий случай». При заполнении следует придерживаться следующего правила: добавлять только те ключевые слова, которые реально присутствуют на странице.

2.2 Структура сайта
2.2.1 Число страниц сайта Общее правило - чем больше, тем лучше. Увеличение числа страниц сайта улучшает его видимость в поисковых системах.
Кроме того, постепенное добавление новых информационных материалов на сайт воспринимается поисковыми системами как развитие сайта, что может дать дополнительные преимущества при ранжировании.
Таким образом, старайтесь размещать на сайте больше информации - новости, пресс-релизы, статьи, полезные советы и так далее.

2.2.2. Навигационное меню Как правило, любой сайт имеет навигационное меню. Используйте ключевые слова в ссылках меню, это позволит придать дополнительный вес тем страницам, на которые ведет ссылка.

2.2.3 Ключевое слово в названии страницы Существует мнение, что использование ключевых слов в названии html-файла страницы может положительно сказаться на ее месте в результатах поиска. Естественно, это касается только англоязычных запросов.

2.2.4 Избегайте подкаталогов Если ваш сайт имеет умеренное число страниц (несколько десятков), то лучше, чтобы они находились в корневой директории сайта. Поисковые системы считают такие страницы более важными.

2.2.5 Одна страница - одна ключевая фраза Старайтесь оптимизировать каждую страницу под свою собственную ключевую фразу. Иногда можно выбрать 2-3 родственных фразы, но не следует оптимизировать одну страницу под 5-10 фраз сразу, скорее всего результата не будет никакого.

2.2.6 Главная страница сайта Оптимизируйте главную страницу сайта (имя домена, index.html) под наиболее важные для вас словосочетания. Эта страница имеет наибольшие шансы попасть в топ поисковых систем.
По моим наблюдениям, на главную страницу сайта может приходиться до 30-40% общего поискового трафика.

2.3 Распространенные ошибки
2.3.1 Графический заголовок Очень часто в дизайне сайта используется графический заголовок (шапка), то есть картинка во всю ширину страницы, содержащая, как правило, логотип компании, название и некоторую другую информацию.
Не стоит этого делать! Верхняя часть страницы очень ценное место, где можно разместить наиболее важные ключевые слова. В случае графического изображения это место пропадает впустую.
В некоторых случаях встречаются совсем нелепые ситуации: заголовок содержит текстовую информацию, но в целях большей визуальной привлекательности выполнен в виде картинки (соответственно изображенный текст не может быть учтен поисковиками).
Лучше всего использовать комбинированный вариант - графический логотип вверху страницы присутствует, но занимает не всю ее ширину. На оставшейся части размещается текстовый заголовок с ключевыми словами.

2.3.2 Графическое навигационное меню Ситуация схожа с предыдущим пунктом - внутренние ссылки на вашем сайте должны также содержать ключевые слова, это даст дополнительное преимущество при ранжировании. Если навигационное меню в целях большей привлекательности выполнено в виде графики, то поисковики не смогут учесть текст ссылок.
Если же отказаться от графического меню нет возможности, не забудьте, по крайней мере, снабдить все картинки правильными тегами ALT.

2.3.3 Навигация через скрипты В некоторых случаях навигация по сайту осуществляется через использование скриптов. Следует понимать, что поисковики не могут читать и исполнять скрипты. Таким образом, ссылка, заданная через скрипт будет недоступна для поисковой системы и поисковый робот не пройдет по ней.
В таких случаях следует обязательно дублировать ссылки обычным способом, чтобы навигация по сайту была доступна для всех - и для ваших посетителей и для роботов поисковых систем.

2.3.4 Идентификатор сессии На некоторых сайтах принято использовать идентификатор сессии - то есть каждый посетитель при заходе на сайт получает уникальный параметр &session_id=, который добавляется к адресу каждой посещаемой страницы сайта.
Использование идентификатора сессии позволяет более удобно собирать статистику о поведении посетителей сайта и может использоваться для некоторых других целей.
Однако, с точки зрения поискового робота страница с новым адресом - это новая страница. При каждом заходе на сайт поисковый робот будет получать новый идентификатор сессии и, посещая те же самые страницы, что и раньше, будет воспринимать их как новые страницы сайта.
Строго говоря, поисковые системы имеют алгоритмы «склейки» зеркал и страниц с одинаковым содержанием, поэтому сайты, использующие идентификаторы сессий, все же будут проиндексированы. Однако, индексация таких сайтов затруднена и в некоторых случаях может пройти некорректно. Поэтому использование на сайте идентификаторов сессий не рекомендуется.

2.3.5 Редиректы Редиректы затрудняют анализ сайта поисковыми роботами. Не используйте редиректы, если для этого нет четких причин.

2.3.6 Скрытый текст Последние два пункта относится скорее не ошибкам, а к преднамеренному обману поисков, но о них все же следует упомянуть
Использование скрытого текста (цвет текста совпадает с цветом фона, например, белое на белом) позволяет «накачать» страницу нужными ключевыми словами без нарушения логики и дизайна страницы. Такой текст невидим для посетителей, однако прекрасно читается поисковыми роботами.
Использование таких «серых» методов оптимизации может привести к бану сайта - то есть принудительному исключению сайта из индекса (базы данных) поисковой системы.

2.3.7 Однопиксельные ссылки Использование графических изображений-ссылок размером 1*1 пиксель (то есть фактически невидимых посетителю) также воспринимается поисковыми системами как попытка обмана и может привести к бану сайта.

3 Внешние факторы ранжирования
3.1 Для чего используется учет внешних ссылок на сайт Как можно видеть из предыдущего раздела, почти все факторы, влияющие на ранжирование, находятся под контролем автора страницы. Таким образом, для поисковой системы становится невозможным отличить действительно качественный документ, от страницы созданной специально под заданную поисковую фразу или даже страницы, сгенерированной роботом и вообще не несущей полезной информации. Поэтому одним из ключевых факторов при ранжировании страниц является анализ внешних ссылок на каждую оцениваемую страницу. Это единственный фактор, который неподконтролен автору сайта.
Логично предположить, что чем больше внешних ссылок имеется на сайт, тем больший интерес этот сайт представляет для посетителей. Если владельцы других сайтов в сети поставили ссылку на оцениваемый ресурс, значит, они считают этот ресурс достаточно качественным. Следуя этому критерию, поисковая система также может решить, какой вес придать тому или иному документу.
Таким образом, существует два основных фактора, по которым страницы, имеющиеся в базе поисковика, будут отсортированы при выдаче. Это релевантность (то есть, насколько рассматриваемая страница связана с темой запроса - факторы, описанные в предыдущем разделе) и число и качество внешних ссылок. Последний фактор также получил названия ссылочная цитируемость, ссылочная популярность или индекс цитирования.


3.2 Важность ссылок (индекс цитируемости) Легко увидеть, что простой подсчет числа внешних ссылок не дает нам достаточной информации для оценки сайта. Очевидно, что ссылка с сайта www.microsoft.com должна значить гораздо больше, чем ссылка с домашней страницы www.hostingcompany.com/~myhomepage.html, поэтому сравнивать популярность сайтов лишь по числу внешних ссылок нельзя - необходимо учитывать также и важность ссылок.
Для оценки числа и качества внешних ссылок на сайт поисковые системы вводят понятие индекса цитирования.
Индекс цитирования или ИЦ - это общее обозначение численных показателей, оценивающих популярность того или иного ресурса, то есть некоторое абсолютное значение важности страницы. Каждая поисковая система использует свои алгоритмы для подсчета собственного индекса цитирования, как правило, эти значения нигде не публикуются
Помимо обыкновенного индекса цитирования, который представляет собой абсолютный показатель (то есть некоторое конкретное число), вводится термин взвешенный индекс цитирования, который является относительным значением, то есть показывает популярность данной страницы относительно популярности остальных страниц в Интернет. Термин "взвешенный индекс цитирования" (ВИЦ) обычно употребляют в отношении поисковой системы Яндекс.
Подробное описание индексов цитирования и алгоритмов их подсчета будет представлено в следующих разделах.

3.3. Ссылочный текст Огромное значение при ранжировании результатов поиска придается тексту внешних ссылок на сайт.
Текст ссылки (или по другому якорный или ссылочный текст) - это текст, стоящий между тегами «A» и «/A», то есть тот текст, по которому можно “кликнуть” указателем мыши в браузере для перехода на новую страницу.
Если текст ссылки содержит нужные ключевые слова, то поисковая система воспринимает это как дополнительную и очень важную рекомендацию, подтверждение того, что сайт действительно содержит ценную информацию, соответствующую теме поискового запроса.

3.4 Релевантность ссылающихся страниц Кроме ссылочного текста учитывается также общее информационное содержимое ссылающейся страницы.
Пример. Предположим, мы продвигаем ресурс по продаже автомобилей. В этом случае, ссылка с сайта по ремонту автомобилей будет значить гораздо больше, чем аналогичная ссылка с сайта по садоводству. Первая ссылка идет с тематически схожего ресурса, поэтому будет в большей степени оценена поисковой системой.

3.5 Google PageRank - теоретические основы Первыми, кто запатентовал систему учета внешних ссылок стала компания Google. Алгоритм получил название PageRank. В этой главе мы расскажем об этом алгоритме и о том, как он может влиять на ранжирование результатов поиска.
PageRank рассчитывается для каждой веб-страницы отдельно, и определяется PageRank’ом (цитируемостью) ссылающихся на нее страниц. Своего рода замкнутый круг.
Главная задача заключается в том, чтобы найти критерий, выражающий важность страницы. В случае с PageRank таким критерием была выбрана теоретическая посещаемость страницы.
Рассмотрим модель путешествия пользователя по сети путем перехода по ссылкам. Предполагается, что пользователь начинает просмотр сайтов с некоторой случайно выбранной страницы. Затем по ссылкам он переходит на другие ресурсы. При этом есть вероятность того, что посетитель покинет сайт и вновь начнет просмотр документов со случайной страницы (в алгоритме PageRank вероятность такого действия принята 0.15 на каждом шаге). Соответственно, с вероятностью 0.85 он продолжит путешествие, перейдя по одной из доступных на текущей странице ссылок (все ссылки при этом равноправны). Продолжая путешествие до бесконечности, он побывает на популярных страницах много раз, а на малоизвестных - меньше.
Таким образом, PageRank веб-страницы определяется как вероятность нахождения пользователя на данной веб-странице; при этом сумма вероятностей по всем веб-страницам сети равна единице, так как пользователь обязательно находится на какой-либо странице.
Поскольку оперировать вероятностями не всегда удобно, то после ряда преобразований с PageRank можно работать в виде конкретных чисел (как, например, мы привыкли видеть его в Google ToolBar, где каждая страница имеет PageRank от 0 до 10).
Согласно описанной выше модели получаем, что: - каждая страница в сети (даже если на нее нет внешних ссылок) изначально имеет ненулевой PageRank (хотя и очень маленький); - каждая страница, имеющая исходящие ссылки, передает часть своего PageRank страницам, на которые ссылается. При этом переданный PageRank обратно пропорционален числу ссылок на странице - чем больше ссылок, тем меньший PageRank передается по каждой; - PageRank передается не полностью, на каждом шаге происходит затухание (та самая вероятность 15%, когда пользователь начинает просмотр с новой, случайно выбранной, страницы).
Рассмотрим теперь, каким образом PageRank может влиять на ранжирование результатов поиска (говорим «может», так как в чистом виде PageRank уже давно не участвует в алгоритме Google, как это было раньше, но об этом ниже). С влиянием PageRank все обстоит очень просто - после того как поисковая система нашла ряд релевантных документов (используя текстовые критерии), отсортировать их можно согласно PageRank - так как логично будет предположить, что документ, имеющий большее число качественных внешних ссылок, содержит наиболее ценную информацию.
Таким образом, алгоритм PageRank "вытесняет" наверх в поиске те документы, которые и без поисковика наиболее популярны.

3.6 Google PageRank - практическое использование В настоящее время PageRank не используется непосредственно в алгоритме Google. Это и понятно - ведь PageRank характеризует лишь количество и качество внешних ссылок на сайт, но совершенно не учитывает ссылочный текст и информационное содержимое ссылающихся страниц - а именно этим факторам придется максимальное значение при ранжировании. Предполагается, что для ранжирования Google использует так называемый тематический PageRank (то есть учитывающий только ссылки с тематически связанных страниц), однако детали этого алгоритма известны лишь разработчикам Google.
Узнать значение PageRank для любой веб-страницы можно с помощью Google ToolBar, который показывает значение PageRank в диапазоне от 0 до 10. Следует учитывать, что Google ToolBar показывает не точное значение PageRank, а лишь диапазон PageRank, в который попадает сайт, причем номер диапазона (от 0 до 10) определяется по логарифмической шкале.
Поясним на примере: каждая страница имеет точное значение PageRank, известное только Google. Для определения нужного диапазона и вывода информации на ToolBar используется логарифмическая шкала (пример показан в таблице)
Реальное значение PR Значение ToolBar 1-10 1 10-100 2 100-1000 3 1000-10.000 4
и т.д.
Все цифры условны, однако наглядно демонстрируют, что диапазоны PageRank, показываемые в Google ToolBar, не равнозначны друг другу. Например, поднять PageRank c 1 до 2 легко, а с 6 до 7 гораздо сложнее.
На практике PageRank используется в основном в двух целях:
1. Быстрая оценка уровня раскрученности сайта. PageRank не дает точной информации о ссылающихся страницах, но позволяет быстро и просто «прикинуть» уровень развития сайта. Для англоязычных сайтов можно придерживаться следующей градации: PR 4-5 - наиболее типичный PR для большинства сайтов средней раскрученности. PR 6 - очень хорошо раскрученный сайт. PR 7 - величина, практически недостижимая для обычного вебмастера, но иногда встречается. PR 8, 9, 10 - встречаются только у сайтов крупных компаний (Microsoft, Google и т.п.). Знание PageRank можно использовать при обмене ссылками, для того чтобы оценить качество предложенной к обмену страницы и в других подобных ситуациях.
2. Оценка уровня конкуренции по поисковому запросу. Хотя PageRank и не используется непосредственно в алгоритмах ранжирования, тем не менее позволяет косвенно оценить конкурентность заданного запроса. Например, если в выдаче поисковой системы стоят сайты с PageRank 6-7, то сайт с PageRank 4 имеет очень мало шансов подняться в топ.
Еще одно важное замечание - значения PageRank, показываемые в Google ToolBar пересчитываются достаточно редко (раз в несколько месяцев), поэтому ToolBar показывает в некотором роде устаревшую информацию. То есть сама поисковая система Google учитывает изменения во внешних ссылках гораздо быстрее, чем эти изменения отображаются в Google ToolBar.

3.7 ТИЦ и ВИЦ Яндекс ВИЦ - взвешенный индекс цитирования - аналог PageRank, применяемый поисковой системой Яндекс. Значения ВИЦ нигде не публикуются и известны только Яндексу. Поскольку узнать ВИЦ нельзя, следует просто помнить, что у Яндекса есть собственный алгоритм оценки «важности» страниц.
ТИЦ - тематический индекс цитирования - рассчитывается для сайта в целом и показывает авторитетность ресурса относительно других, тематически близких ресурсов (а не всех сайтов Интернета в целом). ТИЦ используется для ранжирования сайтов в каталоге Яндекса и не влияет на результаты поиска в самом Яндексе.
Значения ТИЦ показываются в Яндекс.Баре. Следует лишь помнить, что ТИЦ рассчитывается для сайта в целом, а не для каждой конкретной страницы.
На практике ТИЦ можно использовать для тех же целей, что и PageRank - оценка раскрученности сайта и оценка уровня конкуренции по заданному поисковому запросу. В силу охвата Интернета поисковой системой Яндекс, ТИЦ очень хорошо подходит для оценки русскоязычных сайтов.

3.8 Увеличение ссылочной популярности
3.8.1 Сабмит в каталоги общего назначения В Интернете существует большое число сайтов-каталогов (директорий), которые содержат ссылки на другие ресурсы сети, разбитые по тематике. Процесс добавления в них информации о своем сайте называется сабмитом (от англ. submit).
Такие каталоги бывают платными и бесплатными, могут требовать или не требовать обратную ссылку с вашего сайта. Посещаемость их очень невелика, то есть реального притока посетителей с них не получить. Однако, поисковые системы учитывают ссылки с таких каталогов, что может поднять ваш сайт в результатах поиска.
Важно! Учитывайте, что реальную ценность представляют лишь те каталоги, которые размещают прямую ссылку на ваш сайт. На этом моменте стоит остановиться подробнее. Существует два способа простановки ссылки. Прямая ссылка ставится через стандартную конструкцию языка HTML («A href=... и т.д.»). Кроме этого, ссылки можно ставить через различного рода скрипты, редиректы и т.п. Поисковые системы понимают лишь прямые ссылки, непосредственно заданные в html-коде. Поэтому, если каталог не предоставляет прямой ссылки на ваш сайт, то ценность его близка к нулю.
Не следует сабмититься в FFA (free-for-all) каталоги. Такие каталоги автоматически размещают у себя ссылки любой тематики, они игнорируются поисковыми системами. Единственное, к чему приведет сабмит в FFA - это увеличение спама на ваши е-майл адреса. На самом деле главная цель FFA в этом и заключается.
С осторожностью относитесь к обещаниям различных программ и сервисов добавить ваш ресурс в сотни тысяч поисковых систем, каталогов и директорий. Действительно полезных каталогов в сети наберется не более нескольких сотен, от этой цифры и нужно отталкиваться. Профессиональные сервисы по сабмиту работают как раз с таким количеством каталогов. Если же обещаются огромные цифры в сотни тысяч ресурсов, значит база сабмита состоит в основном из упомянутых FFA архивов и прочих бесполезных ресурсов.
Отдавайте предпочтение ручному или полуавтоматическому сабмиту - не доверяйте полностью автоматизированным процессам. Как правило, сабмит, проходящий под контролем человека, дает гораздо лучшую отдачу, чем полностью автоматический сабмит.
Необходимость добавления сайта в платные каталоги, либо проставления ответной обратной ссылки со своего сайта нужно решать отдельно по каждому каталогу. В большинстве случаев особого смысла это не имеет, однако могут быть исключения.
Сабмит сайта в каталоги не дает очень значимого эффекта, однако несколько улучшает видимость сайта в поисковых системах. Возможность эта общедоступна и не требует больших временных или финансовых затрат, поэтому не забывайте о ней при раскрутке вашего проекта.

3.8.2 Каталог DMOZ Каталог DMOZ (www.dmoz.org) или Open Directory Project является крупнейшим каталогом Интернета. Кроме того, в Интернете существует большое число копий основного сайта DMOZ. Таким образом, разместив ваш сайт в каталоге DMOZ, вы получите не только ценную ссылку из самого каталога, но и еще несколько десятков ссылок от родственных ему ресурсов. Таким образом, каталог DMOZ представляет большую ценность для вебмастера.
Попасть в каталог непросто, вернее это зависит от вашего везения. Сайт может появиться в каталоге через несколько минут после добавления, а может и много месяцев прождать своей очереди.
Если ваш сайт не появляется в каталоге в течение длительного времени, но вы уверены, что все сделали правильно и сайт подходит для каталога по своим параметрам, можно попробовать написать редактору вашей категории с вопросом о своей заявке (сайт DMOZ предоставляет такую возможность). Никаких гарантий, конечно, не дается, однако это может помочь.
Добавление в каталог DMOZ бесплатно, в том числе и для коммерческих сайтов.

3.8.3 Каталог Яндекса Присутствие в каталоге Яндекса дает ценную тематическую ссылку на ваш сайт, что способно улучшить позиции вашего сайта в поисковой системе. Кроме того, сам каталог Яндекса способен дать некоторый трафик на ваш сайт. Объем этого трафика зависит от рубрики каталога и ТИЦ вашего сайта (в каталоге сайты сортируются по ТИЦ), в нек

Разное в ИТ   Теги:

Читать IT-новости в Telegram
Информационные технологии
Мы в соцсетях ✉