Web Scraping: 4 wtyczki Wordpress, aby tego uniknąć

Spisu treści:

Anonim

Skrobaki są zmorą istnienia każdego blogera. Web scraping wymiata, kradnie twoją zawartość, twierdzi, że jest ich własnością, a czasami nie ma możliwości udowodnienia, że ​​jest inaczej. Co zaskakujące, Google nie był zbyt inteligentny, by w wielu przypadkach zidentyfikować oryginalnego autora treści. Bardzo często moje Alerty Google powiadamiają mnie o moich zeskrobanych artykułach, a nie o moich oryginalnych (gościnnych) stanowiskach i widziałem, jak skrobaki przewyższały wielokrotnie oryginalne artykuły do ​​wyszukiwania długich ogonów.

$config[code] not found

Od czasu do czasu pojawia się historia blogera, któremu udało się odzyskać prawa do treści, ale jest to raczej walka z wiatrakami. Zabijasz jednego skrobiącego bloga, a dziesiątki rodzą się z dnia na dzień. Dlatego zdecydowanie lepiej jest zapobiegać zeskrobywaniu (lub przynajmniej być oznaczonym jako oryginalny autor) zamiast polegać na jednym z tych rzadkich sukcesów.

Wtyczki zapobiegające zrywaniu stron internetowych

1. Google Plus Authorhorship

Google od wieków stara się walczyć ze skrobakami, a jeden z jego patentów (który jest częścią patentów AuthorRank) sugeruje wykorzystanie autorstwa do:

"…wybrać i zabezpieczyć przed zmianą treści po jej wysłaniu przez osobę lub podmiot. "

Wdrożenie funkcji Google Authorship jest teraz znacznie łatwiejsze (tutaj jest krótki przewodnik), ale w wielu konfiguracjach blogów (na przykład bez autora), może to nadal powodować zamieszanie. W takich przypadkach ta wtyczka pomoże.

Pozwala dodać zdjęcie profilowe G + do wyników wyszukiwania, potwierdzić autorstwo, a nawet nadać autorstwo wielu autorom. Działa na systemie trzyetapowym, który jest bardzo łatwy do naśladowania i nie ma obaw, o które trzeba się martwić.

2. Opóźnienie paszy

Połowa ryzyka dla małego i średniego bloga to skrobak, który zbiera zawartość, publikuje go bez atrybucji, a następnie najpierw indeksuje stronę (co dziwne, Google nie był w stanie odrzucić tych stron lub nawet znaleźć oryginał właściciel treści).

Ponieważ prawdopodobnie masz co najmniej kilka botów ukrywających się w subskrypcjach RSS, najlepiej jest opóźnić wysyłanie wiadomości z powrotem. Ta wtyczka zrobi to za Ciebie.

3. Komunikat Anti-Scraper Feed

Większość skrobania jest wykonywana przez roboty, bez rzeczywistego niedopatrzenia od ludzi. Nie mają więc żadnej kontroli nad tym, jakie treści są publikowane i w jaki sposób. Jest to dla Ciebie duży plus, ponieważ możesz dodać link do swojego bloga we wszystkich treściach, które pojawią się po odesłaniu.

Komunikat Anti-Feed-Scraper robi to, pokazując Google i wszystkich czytelników, z których pochodzi pierwotnie. Utrzymuje również wszelkie oskarżenia z wiadomości, więc chroni Cię przed skandalami roszczeń przez skrobaki. Wiadomość brzmi: Nazwa postu pierwotnie pojawiła się w Nazwa witryny w Data postu.

4. Dowód praw autorskich

Oprócz powyższej wtyczki można użyć tej wtyczki. Umożliwia cyfrową certyfikację własności w chwili publikacji, a następnie wystawianie certyfikatu, który można pokazać w przypadku kradzieży treści. Posiada również licencję na prawa autorskie, licencje i atrybucję w każdym poście. Istnieje dodatkowa funkcja zabezpieczająca przed kradzieżą, jeśli zdecydujesz się jej użyć.

Czy znasz dobry plugin do ochrony zawartości przed Scrapers? A co z poza WordPress?

Więcej w: Content Marketing, WordPress 9 komentarzy ▼