Автор: Санёк
марта 29, 2009
19 комментариев
Контент: как сберечь нажитое.
Сразу хочу извиниться перед читателями за долгое отсутствие
Причина всему учеба и кальян)). К тому же работал над своим новым проектом, который вы вскоре увидете.
Статью эту хотел написать давно, так как проблема актуальная и мыслей скопилось множество. Речь пойдет о защите вашего контента от воровства. Конечно вы скажите, что нельзя защитить контент от воровства на 100% и будете абсолютно правы. Но, согласитесь, можно свести все к минимуму, а зачастую и решить проблему.
Для начала расскажу как выявить факт кражи контента. Для этого существует несколько способов:
- Использование программ. Сначала пользовался DCFinder, но она опирается только на результаты Google и часто ошибается. Сейчас юзаю allsubmitter 5.4 - там есть функция "плагиат". Плагиат ищется через Яндекс, Google и сервис copyscape.com. Довольно надежно на мой взгляд, правда не знаю доступна ли эта функция в бэта версии (лиценз стоит 148$).
- Использование сервисов. Единственным заслуживающим внимание считаю .
- Кражу вашего контента через RSS можно выявить через FeedBurner. Для этого жмем на вкладку "Анализируй" -> Dashboard и ищем пункт "Необычные использования". Там распологаются адреса сайтов, транслирующих вашу RSS ленту.
- Можно и вручную. Ищите в статье уникальную фразу (например, "расскажу как выявить факт кражи контента. Для этого") затем, заключив ее в кавычки, вставляете в окошко поиска Яндекса или Google. Все воры будут поданы на блюдечке
Теперь собственно как защить контент от кражи. Часто контент воруют сплоги. Для тех кто не в теме, цитирую
Сплог по своему виду похож на блог, основное отличие — в контенте. Контент сплогов не является качественным или уникальным, часто он генерируется автоматически с использованием других ресурсов — популярных rss-лент и блогов.
- Чтобы свести к минимуму кражу контента сплогами, можно запретить в индексацию RSS ленты. Для этого нужно зайти в FeedBurner -> Публикуй -> Noindex. Ставим везде галочки и сохраняем. Кстати по поводу сплогов и RSS агрегаторов я писал Платону. Вот наша переписка:
- Не отдавайте в ридер полную версию ленты. Некоторым это конечно не понравится, но ведь всем не угодишь))
- Ставьте ссылки на другие статьи из своего блога в начале поста. Например, напишите что эта статья (статья В) является продолжением опубликованной раннее (ссылка на статью А). Таким образом в случае кражи ленты вы не только укажите поисковикам на автора материала, то есть себя, но и получите немного бэков
- Используйте метки. Например, вместо "авто" пишите "аvто". Потом будет проще найти воришку.
- Можно поюзать плагин оставляющий уникальный электронный отпечаток.
- Для защиты картинок можно использовать ватермарки.
- Иногда картинки не просто воруют, а качают непосредственно с вашего сервера. То есть вместо того чтобы сохранить картинку и залить на свой ftp просто ставится ссылка на местоположение картинки на вашем сервере. Если у вас ограничен трафик, то это может привести к проблемам. К тому же увеличивается нагрузка на сервер. В данной ситуации поможет плагин . Проверить воруют ли ваши картинки можно с помощью сервиса .
- Для защиты картинок можно использовать инвертирование цветов. Открываете картинку в фотошопе и делаете инвертирование цветов. Обработаное изображение загружаете на сервер и вставляете картинку с применением фильтра invert (смотрим учебники по HTML). Минус заключается в том, что обычные пользователи тоже не смогут скопировать картику.
- Поставьте кнопку от с надписью "Страница защищена от копирования сервисом copyscape".
- Пропишите host в robots.txt. Бывают случае когда ищут давно не обновлявшиеся сайты и делают зеркала. В результате ваш сайт может выпасть из выдачи и потерять все бэки (склейка доменов).
Здраствуйте,
Могут ли RSS агрегаторы отрицательно сказаться на моем блоге? Ведь по идее статья может первоначально проиндексироваться в RSS агрегаторе и получится что у меня ворованый контент(( Заранее спасибо.
На что получил ответ:
Здравствуйте, Александр!
RSS-потоки не индексируются нашим основным роботом, которым индексируются сайты и блоги, поэтому проблемы с дублированием контента возникнуть не должно, не переживайте.
Но, как говорится, на Яндекс надейся, а сам не плошай
Что делать если у вас украли контент? Для начала поищите контакты вора на самом сайте или в сервисе whois (лучше сразу начинать с него). Затем пишем гневное письмо с примерным текстом:
Здраствуйте, вы разместили на своем сайте xxx.xx (сайт и ссылки на местоположение украденого контента) мои статьи yyy.yy/1, yyy.yy/2 (список украденого, обязательно полный). Это является нарушением авторского права (почаще о своих правах, законе, и последствиях; главное не переусердствовать - письмо не должно походить на шантаж или угрозу). Просьба убрать эти статьи в течении двух недель. (здесь можно добавить "или мной будут приняты меры" но не забываем про шантаж и угрозы). Приятного дня. (ну или чтонить другое не менее язвительное)) )
Если материал не убран, то пишем абузу хостеру (вспоминаем про сервисы whois). Большинству хостеров проще разобраться с клиентом чем с судом. Если и это не помогло, то бежим жаловаться поисковикам на спам. Если контент действительно украден, то сайт выпадет из выдачи. Проверено опытом друзей и знакомых (у меня проблема решалась на стадии письма). Думаю стоит добавить, что единственным способом доказать свое авторство - отсылать статьи до публикации самому себе через почту. Тогда у вас будет официальный документ (печать почтамта) с датой.
Не стоит использовать различные ява скрипты и коды, запрещающие копипастить, выделять и так далее. Пользы от них никакой - это поможет защитится только от тех, кто компьютер называет "процессор" или "шайтан машина", а им ваш контент не нужен. Зато вред они принести могут. Например, ява скрипт запрещающий выделение текста часто не дает проиндексировать страницу.
З.Ы. Надеюсь эта статья не сделала вас паранойком)) Помните - воруют всегда и у всех.





Молодцом! Хороший пост! Сохранил, на досуге прочту, что нить обязательно из этого буду использовать!
Спасибо.
Надо проверить свой контент, а то после таких статей как-то страшно становится.
admin Reply:
марта 30, 2009 at 18:40
После моих статей у всех фобии появятся))
Заголовок не соответствует содержанию ИМХО.
В посте все о том как действовать для того чтобы на автомате не стащили, а также что делать если стащили.
НО по сути – о том как сделать так чтобы быть первоисточником если стащили все-таки (т.е. как быть чтобы как раз защитить свой контент и быть его первоисточником) – об этом ни слова.
А способ есть
Его можно у Алексея (Burunduk) спросить в порядке частной консультации. Способ реально рабочий, проверенный временем.
admin Reply:
апреля 4, 2009 at 18:16
Очень даже соответствует.
Но ведь это не решает главной проблемы – при копировании контента Ваш сайт может получить фильтр от поисковика. А нужна защита именно от этого, а не просто от того чтобы не стянули, кто захочет – тот стянет.
admin Reply:
апреля 4, 2009 at 20:50
Главная проблема – какая-то сволочь сперла материал. Как с ней разобраться написано в третьей части статьи. В итоге в большинстве случаев удается добится удаления материала с чужого сайта. Но раз ты так настойчив, то напишу позже статью о том как доказать авторство поисковикам.
З.Ы. Если речь идет о фильтре “Ты последний” то это слухи (на данный момент). Пока что было не так много случаев применения данного “фильтра” так что пока рано его признавать. Если бы не bdbd, то о нем вообще мало кто бы догадывался.
Если брать БДБД то там вообще не про это речь была, а про так называемый фильтр “ты последний” и “не так много случаев применения” – вот тут я вообще не согласен. Случаев полно.
admin Reply:
апреля 4, 2009 at 21:48
Я говорил “если речь идет о…” Возможно мне подобные случаи втречались реже.
Ааа спасибо ! Давно искал способ разобратся с подгрузкой картинок , затрахали парсеры грузить сервак , когда мало их , еще ниче , но когда тянут по 200-300 штук то ппц начинается … ))
п.с. А что дает кнопка copyspace на сайте ? Ну стянут запись допустим , а как кнопка это предотвратит ?
admin Reply:
апреля 15, 2009 at 23:52
Это отпугнет школьников
Врятли …. а если этот школьник вообще не знает про такой сервис ? Я допустим недавно сам узнал. Кнопочка антиплагиата если и подействует , то на еденицы ))
Отличный пост, спасибо. От себя добавлю, что можно еще подправить шаблон, чтобы в пост вставлялась ссылка на сам пост. Эта ссылка попадает в RSS feed. В случае если сплоггер не удаляет ссылки, получите лишний бек. Пример использования этого приема на internet-1.su
admin Reply:
мая 3, 2009 at 22:39
И вам спасибо за отличную идею
Добавлю несколько слов о юридических мерах по защите контента.
1. Перед тем как выложить контент в Интернет позаботьтесь о доказательствах своего авторства (отправление распечаток контента самому себе по почте, депонирование с участием нотариуса и т.д.)
2. если нашли сайт-плагиатор, то пишите письмо владельцам сайта. прикрепляйте доказательства своего авторства.
3. если не удается найти контакты владельцев сайта-плагиатора или не они реагируют на письма, то пишем письмо (бумажное!) хостеру, на котором хостится нарушитель. хостер сам надавит на нарушителей или просто заблокирует сайт. опять же не забываем прикрепить к письму доказательства авторства.
3. если и хостер не реагирует на письма, то пишем письмо (бумажное) с жалобой на хостера в Роскомнадзор (Федеральная служба по надзору
в сфере связи, информационных технологий
и массовых коммуникаций). Именно эта госконтора выдает лицензии и следит за работой хостеров.
если есть вопросы – задавайте!
Да уж, тема более чем актуальная. Поисковики не хотят на себя брать ответственность, вернее – не хотят быть судьями в этом скользком вопросе – присуждения авторства. Хотя, вот если подумать, действовали бы по принципу: кто первый встал – того и тапки. Да и фиг с ним. Ответственности никакой. Да мы первый раз обнаружили этот документ на сайте таком-то, поэтому он первый в выдаче, и идите все лесом. Вполне логично. Чтобы уравнять возможности владельцев трастовых и не трастовых площадок, можно сделать в панели вебмастера фичу добавления нового материала, по принципу добавки урлы. Можно сделать это с подтверждением каким-то. Типа документ принят, или проиндексирован, и можете размещать. Только никогда не будет этого. Поисковикам наши проблемы – глубоко фиолетовы. Занимайтесь ребята, а мы – зеркало Российского интернета. Какой интернет – такое и отражение. :-)))))
Насчет “отправлять по почте письмо самому себе” – а как доказать, что в конверте со штемпелем был тот самый контент? Не вскрывать до суда?
Если заклеивать конверт таким образом, чтобы было видно, что его не вскрывали – например, обычным канцелярским клеем, но так, чтобы клей немного выступал из линии заклеивания и штемпель почты оказался на нем, то сойдет такой вариант?
admin Reply:
июня 10, 2009 at 1:16
Да, до суда вскрывать конечно не стоит.
сойдет)