Как правильно провести внутреннюю оптимизацию для поисковой системы Google.

Проанализировав основные ошибки, допущенные пользователями при создании своего сайте, решил сделать нечто вроде общих требований.
Кстати, прежде чем читать это, настоятельно рекомендую ознакомиться с двумя интересными документами:
— Руководство по поисковой оптимизации для начинающих от Google
— Руководство по поисковой оптимизации от Яндекса

Там есть в PDF.
Моя же статья будет опираться на личный опыт и советы Великих из форума Серча по поводу особенностей именно Гугла. Сделал в виде наиболее распространенных ошибок, и как с ними бороться. Итак, поехали…
1. Всплывающие окна. Вообще, все манипуляции с окном браузера – сразу минус. И для пользователей, и для поисковых систем. Это ДРУГОЙ вид привлечения трафика, другой вид заработок. Ведь по сути, поп-апы и поп-андеры уводят клиентов дальше, на другие сайты. Все ПС (и они об этом пишут), против подобной политики. Зачем приводить из поиска пользователя на сайт, который его дальше «посылает» принудительно? Вобщем, всплывающие окна – зло, и в первую очередь – для самих пользователей!
2. Уникальность и неуникальность контента. Вот он – корень всех зол. Неуникальный контент – наиболее распространенная причина падения трафика с поиска. Вы можете проверить свою статью/страницу через тот же copyscape.com. Лучше, чтоб страницы вообще не было в индексе, чем был дубль. Не говоря уже про моральную сторону вопроса. Пишите статьи сами! Сионимайзеры и рерайт, как по мне – чистое зло!
3. Количество страниц «в соплях» и основной выдачи. Если не знаете, что это – почитайте про «сопли в гугле», или Google Supplemental
В двух словах:
Основная выдача: site:domen.com/*
Общая выдача site:domen.com
Сопли: site:domen.com — site:domen.com/*
С цифрами я не уверен, но интуитивно так:
Если у вашего сайта до 100 страниц, то в основном должно быть не менее 35%
Если от 100 до 1000 то 20-30%
Если больше 1000, что 10% вобщем уже довольно неплохо.
Хотя нет придела совершенству! Чем больше тем лучше.
Хотя опять же с цифрами возможно я не уверен, но если менее 10%, то для любого сайта это уже плохо.
4. Дубли страниц внутри сайта. Разные движки (особенно joomala) одну и ту же страницу выводит по разным адресам, например может иметь вид:
site.ru/pro_dizain
site:ru/index.php?content=99944
Такое нужно отследить и убить (через robots.txt, можно поставить 301-редирект).
Если сайт уже проиндексирован, то дубли страниц нужно удалять вручную через панель вебмастера (Кстати, рекомендую такое проделывать не только для гугла, но и для яндекса. Закрывайте ненужные страницы).
5. Чистота кода. У Google в руководстве есть пункт, что правильный и чистый код никаких плюсов не дает. А вот о минусах они умалчивают. Но в любом случае, если будет много ошибок html – это плохо. Во-первых, страница может не успеть загрузиться, во-вторых, грубые ошибки действительно могут дать штраф. Кроме того, много кода – долго грузится. Гугл выделяет определенный лимит на загрузку страницы, и если страница не загрузиться полностью – он так и берет в память себе.
6. Генераторы ссылок/сессий. Многие движки создают уникальные страницы (по каждому заходу или пользователю), создавая таким образом массу дублированных страниц.
Если у вас есть страницы типа session=? Или phses или нечто подобное – сразу идем в robots.txt и запрещаем их к индексированию. Если этого не сделать, вы получите огромное количество дублированного контента.
7. Правильный title. Главное правило – уникальный тайтл для КАЖДОЙ страницы. Не короткий и не длинный (Гугл порядка 70 символов, далее обрезает). Старайтесь избегать ненужных слов в тайтле, например: Магазин: Мой магазин – лучшие товары для дома. Подобный тайтл может быть только у Главной страницы. На странице каталога, лучше: каталог товаров для дома (каталог чайников…). Т.е. прочитав тайтл – сразу должно быть ясно, о чем страница, помним, что тайтл отображается в поисковой системе, и должен «зацепить» пользователя и заставить его перейти на ссылку.
Например, на странице товара: Чайник АК-47 – интернет-магазин товаров для дома.
Как мы видим, использование общих названий допустимо, но начинать title лучше не с него.
8. Правильный discription. Аналогично и Тайтлу, уникальное для каждой страницы, можно довольно длинное (но без фанатизма), с нужными словами и не бессмысленное описание.
Неправильно: В нашем магазине вы в любое время сможете купить чайник.
Правильно: Отличный чайник из серии АК-47 по доступной цене в нашем интернет-магазине Чайников. АК-47 – лучший выбор фанатов чайников
😉 Ну может я чуть загнул, но суть в том что должны быть конечно нужные слова и поменьше общих (в примере – в нашем магазине, в любое время – это лишние слова) Опять же, если вы не продвигаетесь по словам Интернет-магазин, то лучше убрать и добавить что-то другое.
9. При возможности пропишите KeyWords. Говорят что Google их вообще не учитывает, но если есть возможность, вам что, трудно? 😉 К тому же Яндекс и другие поисковые системы берут их «на ура».
10. Контнент выше меню и шапки. Используйте специальную верстку, чтоб в коде основная часть, т.е. ваш контент, стоял как можно выше к началу страницы. Желательно, выше меню и шапки. Сделать это совсем несложно любому программисту с использованием div.
11. Количество ссылок (внутренних и внешних). Не стоит на главной делать меню на все-все страницы Вашего сайта. Используйте «древовидное» меню, как показали опыты – это наиболее удобная структура.
Т.е. с главной ссылка только на разделы.
А уже с разделов – на подразделы и обратно.
Про внешние ссылки вообще молчу, итак понятно – чем меньше, тем лучше. И ставить их надо не в футер, сразу намек на продажность, и все… пиши пропало… Счетчики и рейтинга – закрывайте ноиндексом. Если с рейтинга на Вас нет переходов – убирайте его. Вообще, достаточно одной системы статистики, например Google.Analityc и один рейтинг, например LiveInternet. Любители экзотики могут поставить Рамблер топ100 и Мэил ру. Можно пару своих, узко тематических. Но все-все не ставьте.
12. Страницы: каталог, партнеры, ссылки… Если у вас такие страницы и есть (и они не закрыты через роботс.тхт), называйте их иначе. Есть мнение, что Гугл сразу кипятится, если есть страницы типа site.com/links.php (/cat /partners).
Переименуйте как-то страницу, и напишите тут вразумительный тайтл и дискрипшн. (например, другие поставщики электрочайников) 😉
Да, и неплохо бы на таких страницах побольше контента, кроме кнопок и ссылок.
13. Внутренняя перелинковка. Тут много чего можно написать и, скорее всего, будет тема отдельного повествования (вообще поищите в сети, об этом очень много написано, особенно – про перелинковку для PR). Главное – она должна БЫТЬ, и быть продуманной. Как показали опыта, Гугл учитывает ТОЛЬКО ОДНУ ссылку со страницы на другую. Поэтому, если ссылка есть с меню, то внутри ставить не стоит. Вариант – закрыть через нот-фолоу, или поставить в верстке ПОД основным контентом (через теже дивы).
Важный момент, если перелинкова идет через меню – не делайте пункты меню типа МЫ, О НАС, КАТАЛОГ, УСЛУГИ…
Пишите более четко: Каталог чайников, Про ООО Чайник и т.д., т.к. это АНКОРЫ!
Не делайте меню на flash/картинках/java-скриптах. Флеш хоть и читается Гуглом, но не всегда, и не качественно.
Если уж сделали картинками – пропишите правильные альты.
Но лучше – все же html меню (не ява, он тоже часто криво читается ботами).
14. Главная / и /index. Часто дублируют главную страницу, дела ссылку на site.com/index.php, при том, что сайт имеет еще и site.com/
Будьте внимательны, не дублируйте сами себя.
Кстати, такое часто относится к разным разделам и подразделам:
/product/
/product/index.php
15. Страницы без контента. Если и есть такие страницы, (например, скрипты, или картинки), лучше добавлять все же хоть какое-то описание. Если и нет – то все картинки подписывайте альтом и тайтлом.
Идеально – такие страницы закрыть от индексации, но добавить в карту сайтов с описанием самих картинок (у гугла, да и у Яндекса вроде есть специальный формат для карты сайта-картинок). Кстати, с гугл-картинок идет волне приличный трафик.
16. Анкоры ЗАГЛАВНЫМИ буквами. Часто используют в меню. Не делайте таких ссылок, т.к. боты считают все прописные буквы – спамом. Избегайте подобного.
17. В меню к пунктам добавить Тайтл. Еще один хитрый ход для меню – добавляйте тайтл для ссылок из меню. Причем, осмысленное, а не набор ключевых фраз (но и не полностью продублированное).
18. Футер. Будьте осторожны при заполнении футера (нижней части экрана, он же подвал). Не рекомендуется (для Гугла) дублировать там меню, поскольку, как уже было сказано выше – он учитывает только 1 ссылку на страницу со страницы. А вот Яндекс такое любит. Поэтому ставьте его в ноу-фолоу. Размещение ссылок на внешние сайты с футура – прямой сигнал боту записать вас на подозрение в продаже ссылок. Аналогичный сигнал посылает бот в случае использования уменьшенного шрифта (по сравнению с основным на сайте). Это трактуется как намек на спам-текст в футуре.
19. Длинные адреса страниц. В идеале, адреса страниц должны быть короткими и понятными, имея структуру, типа: site.ru/seo/google/about_code/html
Это намного лучше site.ru/indexphp?=maincontent_7/541/material?8
Вообще, боты неплохо кушают все переменные, но все же уменьшайте количество спецсимволов. Кстати, в Гугл.Вебмастере можно отдельно выделить параметры, какие стоит учитывать, какие нет, типа учитывать ?ID=, не учитывать ?session=
20. Если парсите новости, добавляйте контент НАД новостями. Больной вопрос для новостных порталов, т.к. новости расползаются по сети довольно быстро и без особых изменений. Если вы новостной портал, и распознаны Гуглом как новостной, вам бонус, и не сильно большие штрафы. Если вы просто сайт, и публикуете новости с других сайтов по своей теме, старайтесь, чтоб на этой странице было как можно больше СВОЕГО УНИКАЛЬНОГО контента, и процент дубля был минимальным. Причем, ваш контент в коде страницы должен быть выше, иначе робот зайдет, увидит дублированный контент и может дальше даже не идти… Вообще, вопрос о важности контента в зависимости от расположения на страницу – открыт. Важно, чтоб на главной был именно СВОЙ текст, а не состоял из кусков внутренних страниц.
21. Разнообразие материалов на странице. Старайтесь, чтоб каждая страница имела как можно больше уникального контента. Бывают случаи, что на странице мало текста. Ну вот мало – образцы товара (фото) +2 абзаца. Зато вокруг новости, голосование, шапка, футер и т.д., которые сквозные на всех страницах. Т.о. 5% уникального контента и 95% то, что есть на ВСЕХ других страницах.
Конечно, идеально просто написать еще много-много текста 😉
Но есть и более простой вариант – сделайте некоторые блоки рандомом меняющиеся. Например, футер может быть разный в разных разделах, или вообще подставляться случайно.
Новости можно только на главной (или главной раздела). А можно сортировать и выводить РАЗНЫЕ новости, т.е. непосредственно привязанные к товару, получается что блок новостей по сути уникальный на каждой странице.
Аналогично анонсы. Голосование по разделам. И т.д. Разнообразьте страницу. И пользователям интересно, и поисковикам не стыдно,
22. Откровенные глупости. Ну, если вы используете, клоакинг, подвалы ссылок, спам в тайтле и дискрипшине, невидимый текст, скрытые фреймы и подобные ЯВНО черные методы СЕО, не думайте что вы самый умный 😉
Ну, вот основные ошибки при внутренней оптимизации. Потом напишу про внешнюю.
Пишем, обсуждаем в блоге.


25 января 2010