Уникальность статей в интернете

В продолжение предыдущего сообщения, хотелось бы поделиться мыслями по поводу контента. Под контентом принято понимать любое информационное содержание. Например сайт состоит из меню, шапки, нижнего поля, правого поля и контента. Забавно может получиться, например с новостями. Если они публикуются как просто информация, где-то сбоку, то к контенту не относяться. А если подробно описываются, то это уже контент. Ну да это частности, и вопрос больше философский.

Сейчас проблема контента стоит особо остро. И со временем становиться все острее и острее. Критические размеры это возникло в интернете. Если в офлайне для написания, скажем, статьи, вам надо как минимум прочесть и переписать чью-то другую статью, то в интернете – многие просто копируют, даже не вникая в суть. Просто плагиат в офлайне (написать своими словами то, что уже написано) – в интернете считается достаточно большой и сложной работой, при этом неплохо оплачиваемой, и называемой рерайтингом.
Вот простой пример. Оригинал:
Белеет парус одинокий
В тумане моря голубом.
Что ищет он в краю далеком?
Что кинул он в краю родном?

Рерайтинг ручной:
В затуманенном море можно разглядеть бледное пятно одинокого парусника.
Он покинул родные берега с целью найти что-то лучшее в чужих странах.

Рерайтинг автоматический:
Белеет парус
В тумане моря синего.
Как он ищет краю далеком?
Что бросил его в землю свою собственную?

Сейчас множество различных систем рерайтинга от полуавтоматических до полностью автоматических. Наиболее распространенные системы: замена отдельных слов синонимами (поэтому очень популярна база синонимов, можно найти массу предложений о покупке-продаже подобной базы); перевод текста на какой-то язык, а затем с него – обратно на русский; простая перестановка слов и абзацев (сейчас уже почти не используется, слишком примитивно).
Зачем это делается? Безусловно для заполнения своего сайта информацией. Действительно, зачем писать свою статью, на которую уйдет несколько часов, если можно за 15 минут наворовать множество подобных статей, чуть их изменить.
И действительно что тут такого? Какое воровство? Никто ни у кого ничего не украл. Просто скопировал немного… а на самом деле…
Пробелам авторских прав всегда была актуальной. А в последние десять лет – гиперактуальной: музыка, фильмы, программное обеспечение… а вот теперь еще и просто тексты… информация…
И что самое обидное, что делается это не для пользователей, а в 90% случаев – именно для поисковых систем: для привлечения посетителей на сайт, для увеличения количества страниц… С
Вот статья, которую уже показывал:
— увы, уже сайт недоступен, но в кешах может остаться: https://old.clx.ru/market/article1.html
В гугле я нашел более 50 копий так или иначе с измененным текстом. В лучшем случае, ее просто публикуют с ссылкой на вас. Но это случается все реже и реже…
Кстати, для проверки униальности статей рекомендую пользоваться сервисом от Google:
https://www.copyscape.com/
В последнее время начали использовать еще один вариант копирования: копирование полностью всего сайта, с дизайном, со всем контентом и структурой страниц.
Например, основной сайт adleo.ru
Копии: https://ad-leo.ru/
https://promo-adleo.ru/
И если в первых двух примерах кража контента осуществляется с целью поднятия собственного рейтинга, то в последнем – явные действия конкурентов с целью понижения видимости поисковиками нашего сайта.
Как защищаться от подобных нападок? ПС пытаются разработать алгоритм, который сможет отличать оригинал от копии. Пока это им не очень удается. Основными показателями являются: где появилась информация раньше, какой сайт имеет более высокий рейтинг в целом. Понятно, что оба варианта далеки от идеала. И Яндекс и Гугл предлагают жаловаться на копии. Но и этот вариант не очень.
Лично мы, в случае три (полная копия сайта) меняем свой сайт: и дизайн, и тексты, и структуру. Это проще и быстрее чем переписываться с поисковиками, при том, что гарантии никакой нет. Если копия отдельной инфомрации – ну что ж тут поделаешь. Надо переписывать страницу или писать новую.
Если это вариант два, статья чисто аналитическая… то она даже может принести вам пользу, т.к. в самом тексте упоминается ваша компания, или вы как автор. Конечно, это часто убирают, но у такой статьи, как правило, краткосрочный эффект. Вы разместили ее, пользователи прочитали, и больше она не так актуальна. Лежит себе где-то в архиве…
А вообще, что можно сказать? Базу данных материала на сайте нужно постоянно пополнять и менять. Это хорошо и для поисковых систем, и для ваших пользователей.


13 июля 2009