Много блогове лицензират статиите си. Повечето използват Creative Commons (CC), но има и такива, които запазват всички права върху съдържанието си. Често лиценза позволява копиране на текст и снимки при указване кой е оригиналния автор с линк. Една спорна тема обаче е прекопирането на цели статии. Макар това технически да се позволява от повечето лицензи, то не е се гледа с добро око от авторите.
Причината е, че (CC) лиценза има за цел да позволи на други да творят въз основа на създаденото – цитирайки откъси, преработвайки снимки или използвайки ги в друг контекст. При прекопирането на статии няма никаква добавена стойност, а просто възползване от труда на автора. С моя лиценз разрешавам, но давам условия за прекопиране на цели статии. Накратко – всички линкове в статията трябва да се запазят и името ми с линк към блога да е в началото на страницата. До сега доста сайтове са го спазили и са се свързали с мен за допълнително разрешение.
WP-Kradeno на помощ
Проблемът с останалите често е, че няма начин да се открият без да са сложили обратен линк. Това не е съвсем така и тук идва новата ми добавка за WordPress – WP-Kradeno. Накратко, тя търси из мрежата сайтове с подобни на вашите текстове. Накрая ви ги подрежда по вероятност. От там нататък е ваша работа да се свържете със собственика и да го убедите да промени статията си. Против очакваното, 8 от 10 сайта, на които писах, вече промениха копираните статии според лиценза ми. Това значи, че има смисъл от добавката.
Пример за започнало търсене с няколко резултати от блога ми
Как работи?
След като я инсталирате, ще видите два панела – „Отчети“ (в менюто „Постове“) и „Настройки“. В Отчети може да пуснете проверка за копирани постове. Тъй като добавката използва Google Search многократно за всеки пост, търсенето става сравнително бавно в зависимост от това, колко статии имате и каква е дължината им. Забавянето обаче не се отразява на бързината на блога ви за останалите посетители. Също така, съществува ограничение на броя запитвания към Google за час, за да не ви маркира като спамър. При привършване на запитванията, търсенето спира и може да го пуснете след час за да провери останалите статии.
Когато завърши, в „Отчети“ ще видите откритите статии с оценка до колко е вероятно да са копирани, както и заглавията им. Информация за това ще видите и на началната страница на админ панела. След като ги проверите лично, може да ги пренебрегнете, да ги маркирате „с предупреждение“, „успешна промяна от автора“ или „с разрешение за копиране“. Има възможност също така, дадения домейн да се изключи от всички бъдещи търсения. Това е полезно за RSS агрегатори, форуми, Facebook или приятелски блогове. Глобално изключените сайтове, максималния брой запитвания към Google и минималната оценка на страница при търсене могат да се променят в Настройки.
Съобщение на началната админ страница за открити сайтове
Страницата с настройки и сайтовете, които аз съм изключил глобално
Айде сега – ГДБОП-щини?!
Може би ще се запитате – не е ли това нещо като на приключенията на ГДБОП и тоталното следене в мрежата. Не – добавката ми търси в Google за сайтове, които копират статии без да са си направили труда да упоменат първоизточника. Не става дума за пари, пиратство или следене на трафика на посетителите, а за уважение. Ако читател може да намери сайта в Google, значи и WP-Kradeno ще може. Също така, нищо в добавката не може да задължи недобросъвестния автор да промени копирания текст или да се поучи – това е работа на Блогосферата. Добавката ми е просто инструмент за търсене в една публична база данни, каквато е Google.
Повече информация може да намерите в описанието и FAQ-то й. Кодът й не е много елегантен, но за две нощи кодиране – толкова. Ако откриете проблем или имате предложение, моля пишете ми в коментарите. Ако сте регнати в WordPress.org, ще съм ви много благодарен, ако оцените добавката там и посочите дали работи. Естествено преведена е на български, но набързо, затова пишете, ако намерите грешки.
Svejo2WP коментари – вече работи и има админ панел
Супер! Само за WordPress блогове ли работи?
Малка бележка – както при всеки WordPress plugin и този може да се влияе от други такива или от специфични промени на блога ви. Ще се радвам, ако ми съобщавате тези проблеми, за да се опитам да ги оправя и да са наясно другите.
@Рошо – само за WP съм го направи за сега. За други блог системи не съм писал добавки, но във FAQ-то на plugin-а съм написал как може да се използва кода за други страници. Ще ти трябват обаче познания за php.
@Рошо – впрочем обмислям и публична услуга на базата на тази добавка. Там просто ще се вкарва адреса на страницата и ще се търсят плагиати. Още не съм измислил как ще стане точно обаче.
Това задължително се слага 🙂 Благодаря за полезния плъгин! След 1 минута го пускам да си върши работата, а по-късно (ако ми остане време днес) ще пусна една публикация.
@TechStationBG – Супер! Пиши дали ти работи, защото последната версия са я тествали само няколко човека.
Впрочем, ако използвате добавката, ще се радвам, ако споделите колко истински прекопирани статии сте намерили.
Подобна услуга предлага http://www.copyscape.com. Действа бързо, а доколкото съм го тествала резултатите са добри.
@sky_mender – погледнах го – наистина прави същото, но 1. платен е, 2. има ограничения за търсенето и 3. не го прави автоматично за целия ти блог. Плюсът е, че работи на сървър и става за сайтове различни от WordPress. И аз обмислям такава услуга, но ще е почти изцяло безплатна и няма да има ограничение за търсене.
Страхотна добавка! Веднага я слагам да моя блог и този на жена ми и почваме тестовете. И без това ни е писнало да ни крадат статиите от официалния ни сайт за История на България, но той е на Joomla и за съжаление там няма как да ползвам приставката. Все пак ще се опитам да я пригодя и ако стане задължително ще пусна кредит към автора. Шервам и настоящата статия във фейса 🙂
Поздрави!
@Каравеликов – Вторият скрипт съдържа всички нужни php функции. Не би трябвало да е сложно да се адаптира. Трябва просто един loop из всички статии, който да изкарва текста и после да се подаде на основната функция. Тя маха таговете, цепи текста и прочие Останалото от plugin-а е просто шарения и userfriendly работи.
Включил съм и втори алгоритъм, който е подобен, но взима само текстове според структурата (т.е. в таговете). Той обаче не работи добре, ако в статията има предимно таблици и много линкове. В следващата версия ще включа и двата да работят адаптивно спрямо типа статия и дължината на изреченията.
Здравей. Инсталирах и тествах плъгина. За откриване на текстове работи доста прилично. Когато текстовете са кратки хваща и резултати, които имат само по няколко съвпадащи ключови думи, но то лошо няма. Проблем има при англоезични постове със снимки, защото изкарва всевъзможни резултати от форуми, блогове и места за хостване на картинки. Може би по това трябва да се поработи, но засега не мога да кажа повече.
Факт е, че откри и съвсем реални резултати на статии, пускани и на други места, така че мога да кажа съвсем съвестно, че плъгина изпълнява функциите си!
Ако успея да го пригодя за джумла, ще пиша.
Поздрави.
@Каравеликов – Първата ми цел беше да изкарва повече резултати, макар и някои да са грешни. Тествал съм го предимно с български постове. За снимките наистина е така и това се забелязва също при embed. Ще се опитам да го подобря в тази насока, но в крайна сметка винаги ще трябва да се преглежда от човек. Може би вдигане на летвата на 0.5 за оценката би било нещо логично в този смисъл, но едва след като поправя адаптивния алгоритъм.
Наистина пиши като имаш нещо за Joomla, за да го линкна. В следващата версия ще отделя кода, който е универсален от този за WP, за да може по-лесно да се портва.
При мен не иска да запали 🙁 Предполагам, че има конфликт с останалите плъгини (общо 19), но може и да се окаже някоя моя боза, която не съм оправил след последния ъпдейт на Thesis и WP. След като оправя нещата ще драсна каква е била причината WP-Kradeno да не работи и как съм решил проблема.
П.С: г-н Юруков, в заглавието ви има грешка, както и в URL-то…. освен ако не е нарочно. Нали плъгинът ви се казва WP-KrAdeno, а не WP-KrEdeno?
Svejo: oks
Поздравления! Добра идея и успешна реализация! Инсталирах го на един от блоговете си и работи прилично. Хвана няколко статии със същия текст, но за щастие ставаше въпроса за прес съобщение. За късмет никой не ме краде. Може би просто не пиша нищо интересно, което да си заслужава да бъде откраднато 🙂
Все пак, проставката е полезна. Ще я инсталирам навсякъде.
Благодаря!
Много добър, браво, поздравления и адмирации за идеята и осъществяването! Като за първоначална версия, ето моите отметки:
1. Две правописни грешки, направени в бързината – аз също често правя такива 😉 –
пренебреднат за един пост – пренебреГнат 🙂
отбелязан с прдупреждение за един пост – прЕдупреждение;
2. Въпреки, че всеки може да си промени показателя минимална оценка на резултатите, лично аз мисля, че 20% съвпадение е прекалено висок критерий – като го пуснах с настройките по подразбиране, не намерих никакви нарушения в неща, които са дори под 50%. Не знам, това може да важи само за мен, един вид – уникален резултат и показател, но като мине един час, ще пробвам направо със стойност 0.6;
3. Когато се направи дадено действие (примерно пренебрегнат) за много на брой сайтове, в които са открити съвпадения – горе, в жълтото поле всичките тия сайтове се показват на един ред, или поне при мен в последна версия лиско така се вижда. Е, ако в името на сайта има тире, чак тогава се пренася на следващ ред, но при всички положения излиза страшно много извън очертанията. Екранна снимка:
Ако го направиш така, че при изреждането след запетаята да има интервал (non breaking space?), предполагам няма да има проблем.
4. При мен прогрес бара не се движи, дори и когато е приключила проверката все още си стои на изчакайте … започва …. Иначе си работи, щото като са минали 10 мин., и като съм видял, че в табчето на лиското е спряло да се върти Зареждане, значи е готово, и като проверя – има резултати.
Супер е! Работи! Поздрави, Бояне!
Много добър и полезен плъгин. Ще го пусна и аз при първа възможност за Joomla.
@TechStationBG – 10х за заглавието – оправих го. За добавката – на 2-3-ма други не им тръгва. Възможно е наистина да е наистина да прави проблем с други добавки. Въпреки, че не виждам как, защото не променя нищо в работата на блога, опита ни учи, че точно в такива случаи стават най-големите бъгове. Виж третия въпрос от долу нагоре във FAQ-то и ако имаш време, ми прати какво ти се получава.
@Майк Рам – нещо, което пропуснах да напиша е, че не винаги от първия път хваща всичко. Това е една особеност на Google – дава различни резултати в различни дни. Затова аз ще го пускам всяка седмица. При няколко търсения, вече откритите резултати се усредняват като оценка с новите и така има по-точна преценка.
@Assenoff – Благодаря за грешките в текста – ще ги оправя тази вечер. Това за 50% е добър вариант, но искам първо да усъвършенствам алгоритъма, така че да се адаптира към типа статии и количеството текст в тях. Чак тогава ще сложа 0.5 по подразбиране. Списъка със сайтове също ще го съкратя като ще е нещо от типа „www.neasdasdasd.com, ww. adsdasdasd.de и още 20 сайта…“. Последното според мен е проблем в javascript-а. Опитал съм се да го направя да поддържа различни frameworks, макар, че най-честата е JQuery. Все пак изглежда нещо в js-а се чупи. Имаш ли firebug или някакъв друг debugger?
@Иво Мирчев – Благодаря 🙂 Пусни един глас в wordpress.og, ако не си още.
@Тихомир – прати линк като го пуснеш. Ще е добре да го има за повече CMS-и. Всичко, което ти трябва е във втория php файл.
Полезен плъгин. Както спомена някой по-горе и при мен статус бара не се пълни, а направо казва, че е готово и излиза пълен. Малко неудобно излизат само неверни резултати за снимките, явно използваш и етикетите, че не съм поглеждал. Поздрави за труда
-> fantastic! rating
-> WP2.9 + Plugin 0.7 = works
@CHILIEV – По принцип трябва да реже всички http тагове и може би засича коментарите под снимките. Трябва да го тествам с по-широк кръг статии. Алгоритъмът в основната си част работи, но наистина има какво да се желае. Ако имаш акаунт в wp.org, кликни, че работи, за да се съберат достатъчно данни.
Имам и кликнах. Това имах предвид с тея -> накрая.
😉
п.п. чак сега виждам това с подскачането на аватарите от куот. Много е маниашко (thumb up)
@CHILIEV – супер 🙂 подскачането е част от благинките дето съм добавил в коментарите. Наскоро имаше и още две.
@TechStationBG – Благодаря за статията 🙂 Виж дали ще ти даде нещо като викнеш Това е скрипта, който фактически върши работата. Иска обаче админ права за да тръгне.
@Боян Юруков – Има нещо много, много сбозено в цялата инсталация на WordPress 2.9.2… тръгвам по мъките на преинсталацията 🙂
@TechStationBG – може това да е, да. Ако не си го изтрил още, може да видиш в error-log-а в папката wp-admin. Там може да има нещо подсказващо защо тази добавка, а и други неща не ти работят.
@Боян Юруков – Ами да! Както си и мислех 🙂 След ъпдейта съм забравил да коригирам в wp-settings колко MEMORY да ползва блога… а се чудех 2 седмици какво пак съм сбозил 🙂 Та в момента WP-Kradeno си врътка, тъкмо да си разходя кучето и да видя какво ще покаже 🙂
@TechStationBG – Супер! Значи това е един възможен проблем. Ще го добавя във FAQ-то довечера.
По всичко личи, че това е много полезен плъгин! Веднага щом остане време ще го тествам
Има един сайт – http://www.copyscape.com/ – който върши същата работа. Пак безлпатно и накуп (т.е. за всяка публикация в сайта, ан е една по една). Аз го ползвам от доста време – за ужас на няколко плагиататори и провокатори! 😉
@Пламен Петров (Пламски) – По-горе sky_mender го спомена този сайт. Не е вярно, че е безплатен, защото ти показва само първите 10 резултата. За останалите и за постоянно следене трябва да си платиш. Освен това не проверява всички публикации, а само тези, които са на заглавната страница. Всъщност въобще не проверява статиите ти, а откъса от тях, който се вижда на заглавната. Затова се налага една по една всяка статия да се въвежда, за да си сигурен. Алгоритъма им обаче сякаш е по-добър от моя.
Поздравления за плъгина! Още не съм го пробвала, но звучи страхотно. А и има превантивен ефект – някои хора ще се замислят, преди да копират. Макар че, те ако можеха да мислят, нямаше да преписват мислите на други хора… 😉
@Мариана Евлогиева – не знам все още какъв ефект има за други и дали им е помогнало да премахнат част от копираното съдържание, но при мен има – вече поне 15 сайта са сложили обратен линк към блога ми над копирани статии. Целта не е да се следи нета, а да се въведе някаква норма на копиране. Лицензите са ни достатъчно свободни, за да може всеки да препечатва, каквото смята за интересно. Затова е неразумно, че се пропуска да се отчете труда на другите. Най-малкото не прави добро впечатление. Дано наистина да има превантивен ефект.
@Боян Юруков
Напълно съм съгласна с теб! Нека всеки копира, колкото си поиска, но да казва откъде. Аз не копирам като текст дори мои собствени статии, ако са публикувани първо на друго място. В моите блогове слагам само линк и скрийншот на страницата в другия сайт, където съм ги дала за публикуване.
Интересно но нима в бг 70% от статиите които са по сайтовете не са крадени
или поне вземани откъси оттях
лично аз докато се учех и пробвах с писане и събмитвне на линкове винги съм поставял линк от къде черпя инфо
качих си сега Twitter application za Iphona
много добре отваря ти сайтовете в самата аплилация не те иЗхвърля от апликацията
интересно какво може още
Поздравления за плъгина – върши добра работа!
Възможно ли е да се ограничи търсенето така, че да проверява само последния пост примерно, или да му задаваш пост който да търси – а не да проверява всеки път всичко?
@Longanlon – Има няколко функции дето се каня да въвеждам. Може би тия няколко дни ще си поиграя. Едното е да се спира изцяло проверките за някои статии. Също така процента съвпадение да се увеличи на 60%. Това за последните 5 или 10 статии е също добра идея. Ще трябва да увелича и стойността на версията, която поддържа.
цар си баце 🙂
Цар, цар, ама да видя дали ще се наканя да го направя. Много ми е къс attention span-а. Тия две седмици ще имам повече време, така че може и да стане 🙂
да те ръчкам, ако трябва :Р
Плъгина е перфектен! Ползвам го откакто си го пуснал и върши страхотна работа. Тъкмо преди няколко дни пак го възхвалявах, че хвана двама кълвачи-преписвачи.
@Karavelikov – Благодаря. Другата седмица очаквайте нова версия 🙂
вече е другата седмица и ние очакваме 🙂
Добре. Пуснах нова версия 🙂 Още не е одобрена в WP.org, но може да я свалите тук: http://yurukov.net/blog/wp-content/uploads/2010/05/wp-kradeno.zip
Пишете ми ако забележите някакви проблеми.
Айде, ако някой го пробва, да ми каже как е минало, за да напиша статия да го обявя.
тествах го – работи!
добре е направено да могат да се проверяват само статиите в последните 3 месеца, както и да могат да се изключват сайтове
засега виждам само 1 нещо което ме озадачава – не знам какъв е алгоритъма за %съответствие който ползваш, но при 1 абзац (свежо или някой който публикува моя рсс) дава 70%
@Longanlon – да ти кажа и аз вече съм го забравил алгоритъма. Мисля, че взимаше по няколко израза по 3 до 6 думи и ги проверяваше в Google. Ако намери 5 от 10 израза в друга статия, значи има съвпадение 70%. Не помня обаче какъв беше минимума. Определено обаче ще хваща RSS четците и svejo. За това при мен съм ги сложил в глобално пренебрегнатите сайтове.
Ще разгледам пак алгоритъма. Щом работи обаче ще пусна статия тия дни да обявя, че е обновено. Дано скоро одобрят кода във WP.org.
в страницата за проверка, някои цъкчета са цъкнати но сиви – не могат да се отцъкнат – какво означава това?
кои цъкчета? Дай снимка.
ето го – цъкнал съм горе да се видят избираемите цъкчета които са по-тъмни
А, това е защото има само един сайт и по подразбиране е избран, за да се направи действие с падащото меню под него. Мисля да променя дизайна на действията и бутоните, но в следващата версия. Сигурно ще е като измисля по-добър алгоритъм.
в следващата версия на плъгина може да има възможност за докладване на Гугъл с 1 клик 🙂
https://www.google.com/webmasters/tools/dmca-notice?hl=bg
за целта ше трябва да го вържеш с гугъл профила на човека де
Продължавам фийлд рипортите по плъгина 🙂
По някаква причина той не хваща неща, публикувани в сайтовете на вестниците Труд и 24 часа. От сайта на Монитор хваща, но на тия двата – не.
Интересно. Може ли да ми пратиш линк на страница в Труд и твоя статия, за да видя защо Google не го засича? Може да са си направили нещо на кода или просто да са забранили индексирането.
http://www.24chasa.bg/article/1245609
Труд не са я откраднали, но все пак би трябвало да хваща съответствието нали 🙂
Да, така е. Ще го погледна утре, че сега съм на работа.
Имаш ли го пуснато в твоя блог?
да разбира се, от къде мислиш го тествам
Здравейте.
Активно ли е още приложението?
Ще може ли да провери блог с около 1000 статии?
Благодаря.