netfreaks.gr | internet crossroad

14 Sep 10

Content Scraping - a pain in the ass


Ακόμα ένα Ελληνικό blog σήμερα ανακοίνωσε ότι περιορίζει το RSS Feed του. Έχει γίνει και στο παρελθόν και φυσικά δεν είναι αποκλειστικά φαινόμενο δικό μας, συμβαίνει παντού. Γιατί όμως να “τιμωρηθεί” ο πιστός αναγνώστης που θέλει να διαβάζει από τον RSS Reader του;

Είναι λύση ο περιορισμός του περιεχομένου; Για μένα όχι, δεν έχει νόημα να αχρηστεύεις την υπηρεσία με το να πετσοκόβεις την ροή του περιεχομένου.

Τι είναι το Content Scraping;

Το Content Scraping είναι μια αυτοματοποιημένη διαδικασία μέσω του x,y λογισμικού και έχει ως αποτέλεσμα την αντιγραφή ολόκληρου/ή μέρους του περιεχομένου με σκοπό αυτό να καταλήξει σε κάποιο site/blog που θα εκμεταλλευτεί τα keywords για να κερδίσει οτιδήποτε. Δηλαδή μιλάμε για μη εξουσιοδοτημένη χρήση [ κλοπή ] περιεχομένου σε κάποια ιστοσελίδα με σκοπό το προσωπικό κέρδος, ενώ παράλληλα η ίδια αυτή χρήση “βλάπτει” τον αρχικό συγγραφέα καθώς δημιουργούνται συσχετισμοί του site του με τα εκάστοτε splogs.

Αλλά… Welcome to world wide web. Δεν είσαι όμως ανυπεράσπιστος.


Και τι μπορεί να κάνει ο δημιουργός του περιεχομένου;

Πολλά! Καταρχάς μπορεί να περιορίσει το RSS feed του… κάτι με το οποίο όμως διαφωνώ κάθετα. Έστω και προσωρινά, μέχρι να γίνει προσπάθεια για οριστική λύση, δεν βρίσκω νόημα στο να “τιμωρείς” [ επαναλαμβάνομαι ] τους αναγνώστες σου.

Εφόσον έχεις κάποια licence με την οποία προστατεύεις το περιεχόμενο σου, είτε full copyright, είτε κάποια CC, μπορείς να περάσεις στην αντεπίθεση.

Υπάρχουν διάφορα εργαλεία που αρχικά θα σε βοηθήσουν να ελέγξεις για αντιγραφές των κειμένων. Το πιο γνωστό από τα free είναι το Copyscape, αλλά δεν είναι το μόνο. Ακόμα και μέσω trackbacks μπορείς να βρεις τους παράνομους, θέληση να υπάρχει. And then?

Τα βασικά:

  • Να προσπαθήσεις να επικοινωνήσεις απευθείας με τον φερόμενο ιδιοκτήτη [ good luck with that ]
  • Να επικοινωνήσεις με την Google. Τις περισσότερες φορές, πιάνει.
  • Και τέλος, αν βρεις τον hosting provider, να κάνεις τα κόλπα σου ώστε να τον κατεβάσει. Η κλοπή είναι κλοπή και θα ακουστείς.

Βέβαια, όλα τα παραπάνω είναι χρήσιμα όταν έχει γίνει ήδη το κακό. Ποιος είπε όμως ότι δεν μπορείς να το προλάβεις; Για όλα υπάρχουν λύσεις. Δεν θέλω να αναφερθώ αναλυτικά, αλλά μπορούν να βρεθούν plugins για συγκεκριμένες πλατφόρμες [ i.e. WordPress με διάφορους τρόπους λειτουργίας ] αλλά και γενικευμένα εργαλεία όπως το AntiLeech και το Tynt και σίγουρα πολλά άλλα που μου διαφεύγουν.

Επίλογος

To συμπέρασμα είναι ότι για όλα υπάρχουν λύσεις. Όπως και το ότι πάντα θα αντιμετωπίζεις ανθρώπους που προσπαθούν να εκμεταλλευτούν την δημιουργία σου και εσύ θα πρέπει να “απαντήσεις”,  να αμυνθείς, με γνώμονα φυσικά την προστασία και του αναγνώστη που στο κάτω κάτω, δεν φταίει σε κάτι.

Υ.Γ.: Ελπίζω να μην θιχτεί κανένας, σέβομαι τις αποφάσεις του καθενός, αλλά οφείλω να παραθέσω την άποψη μου. Εξηγούμαστε για να μην παρεξηγούμαστε smile

Σου άρεσε το θέμα; Πάρε το RSS feed για να διαβάζεις παρόμοια άρθρα!

Socialize


1 Σχόλιο

  • Χριστίνα 13/10/2010 at 05:44

    Δεν ξέρω αν είναι “ηθική” λύση, μιας και ο δημιουργός του περιεχομένου αποφάσισε να το διανείμει με έναν συγκεκριμένο τρόπο,  πάντως σε τέτοιες περιπτώσεις χρησιμοποιω την free υπηρεσία http://www.wizardrss.com για πρόσβαση στο πλήρες άρθρο…

Η γνώμη σου

Ενημέρωση για νέα σχόλια


Copyright © 2006-2018 netfreaks.gr • All Rights Reserved • Powered by Wordpress • Design by Gerasimos Tsiamalos • seamless Hosting by Cityhost