Τι είναι το Wayback Machine και γιατί είναι χρήσιμο;
Διαδίκτυο Ιστοσελίδες Ήρωας / / April 22, 2021
Τελευταία ενημέρωση στις
Το Wayback Machine είναι το πιο δημοφιλές μέρος του Ιστότοπος Αρχείο Διαδικτύου. Παρουσιάστηκε για πρώτη φορά το 2001, το δωρεάν διαδικτυακό εργαλείο σάς επιτρέπει να "επιστρέφετε στο παρελθόν" για να δείτε πώς μοιάζουν οι ιστότοποι σε όλο τον κόσμο σε χρονικά σημεία. Η μηχανή Wayback διαθέτει 562 δισεκατομμύριο ιστοσελίδες κατά τη στιγμή αυτής της γραφής, με πολλές ακόμη προστιθέμενες κάθε χρόνο.
Ακολουθεί μια ματιά στο Wayback Machine και τι το κάνει ξεχωριστό.
Εισαγωγή στο Διαδίκτυο Αρχείο
Δημιουργήθηκε από τους Brewster Kahle και Bruce Gilliat, το Internet Archive είναι ένας μη κερδοσκοπικός οργανισμός με δηλωμένη αποστολή «καθολική πρόσβαση σε όλες τις γνώσεις». Από την αρχή, ο οργανισμός παρέχει δωρεάν πρόσβαση στο κοινό σε ψηφιοποιημένο υλικό, όπως ιστοσελίδες, βιβλία, ηχογραφήσεις, συμπεριλαμβανομένων ζωντανών συναυλιών, βίντεο, εικόνων και λογισμικού προγράμματα.
Μέχρι σήμερα, όλα όσα συλλέγονται από το Internet Archive καταλαμβάνουν περισσότερα από 70
Η μηχανή Wayback
Μόνο ένα μέρος του Internet Archive, το Wayback Machine, σχεδιάστηκε για να καταγράφει περιεχόμενο ιστότοπου που έχει αλλάξει ή καταργηθεί. Από την κυκλοφορία του, έχει γίνει ένα από τα πιο δημοφιλή και αναγνωρισμένα μέρη στον Ιστό. Οι Kahle και Gilliat ονόμασαν τον ιστότοπο μετά από τη φανταστική συσκευή που ταξιδεύει στο χρόνο στη σειρά κινουμένων σχεδίων της δεκαετίας του 1960, The Rocky and Bullwinkle Show.
Αν και το Internet Archive δεν κυκλοφόρησε τον ιστότοπο στο κοινό μέχρι τον Οκτώβριο του 2001, το Wayback Machine άρχισε να αρχειοθετεί προσωρινά αποθηκευμένες ιστοσελίδες από τον Μάιο του 1996. Μέχρι το 2001, οι ψηφιακές ταινίες είχαν αποθηκεύσει πληροφορίες που ήταν προσβάσιμες μόνο σε επιλεγμένους επιστήμονες και ερευνητές. Όταν τα πάντα κυκλοφόρησαν στο κοινό πέντε χρόνια αργότερα (όπως είχε προγραμματιστεί από καιρό), είχε ήδη πάνω από 10 δισεκατομμύρια αρχειοθετημένες σελίδες.
Αποθήκευση και συλλογές
Σήμερα, ο ιστότοπος διατηρεί ιστορικά δεδομένα ιστού σε ένα σύμπλεγμα κόμβων Linux. Το Wayback Machine κατεβάζει όλα τα δημόσια προσβάσιμα αρχεία πληροφοριών και δεδομένων σε ιστοσελίδες μέσω του μηχανισμού ανίχνευσής του. Ωστόσο, δεν περιλαμβάνονται όλα όσα δημοσιεύονται σε έναν ιστότοπο, δεδομένου ότι κάποιο περιεχόμενο περιορίζεται ή αποθηκεύεται σε βάσεις δεδομένων, οι οποίες δεν είναι προσβάσιμες. Εξαιτίας αυτού, ορισμένοι ιστότοποι ανιχνεύονται καλύτερα από άλλους, ανάλογα με το πώς οι προγραμματιστές δημιούργησαν έναν ιστότοπο κάθε φορά.
Θα παρατηρήσετε επίσης ότι όσο πιο πρόσφατο είναι το αρχείο, τόσο περισσότερο διαθέσιμο περιεχόμενο για κάθε δεδομένο ιστότοπο. Ένα νέο εργαλείο το Internet Archive που παρουσιάστηκε το 2005 είναι ένας από τους λόγους για τους οποίους τα νεότερα δεδομένα είναι πιο ολοκληρωμένα. Το Archive-It.org βοηθά να ξεπεραστούν οι ασυνέπειες σε μερικώς αποθηκευμένους ιστότοπους, επιτρέποντας σε ιδρύματα και δημιουργούς περιεχομένου να συλλέγουν και να διατηρούν συλλογές ψηφιακού περιεχομένου.
Σχετικά με την ανίχνευση
Τα προγράμματα ανίχνευσης ιστού, που μερικές φορές ονομάζονται spider ή spiderbot, είναι τόσο παλιά όσο το ίδιο το Διαδίκτυο. Αυτά τα προγράμματα ανίχνευσης είναι ρομπότ Διαδικτύου που περιηγούνται συνεχώς στον Ιστό για σκοπούς ευρετηρίασης, καθιστώντας τα σημαντικό συστατικό κάθε σύγχρονης μηχανής αναζήτησης. Τα προγράμματα ανίχνευσης που χρησιμοποιήθηκαν για το Wayback Machine για τη δημιουργία ψηφιακών στιγμιότυπων ιστότοπων προέρχονται από διάφορες πηγές, οι οποίες έχουν αλλάξει με την πάροδο του χρόνου.
Όπως θα παρατηρήσετε γρήγορα, η συχνότητα λήψης στιγμιότυπων ποικίλλει σημαντικά από τον ιστότοπο. Συνήθως, όσο μεγαλύτερος (και ίσως πιο δημοφιλής) ιστότοπος, τόσο πιο ανιχνεύεται. Επιπλέον, πολλά εξαρτώνται από το πόσο συχνά ένας ιστότοπος αλλάζει σελίδα. Ακόμα και οι μικρότεροι ιστότοποι ανιχνεύονται, εκτός εάν υπάρχει λόγος να μην είναι. Για παράδειγμα, οι ιστότοποι που προστατεύονται με κωδικό πρόσβασης δεν ανιχνεύονται και ούτε ιστότοποι των οποίων οι κάτοχοι ιστότοπων ζήτησαν να μην συμπεριληφθούν.
Χρήση της μηχανής Wayback
Ο ιστότοπος της Wayback Machine είναι εύκολος για όλους. Για να βρείτε ιστορικά στιγμιότυπα ενός ιστότοπου, πληκτρολογήστε το όνομά του στη μηχανή αναζήτησης του ιστότοπου. Στη σελίδα αποτελεσμάτων αναζήτησης, οι υπερσύνδεσμοι δηλώνουν ημερομηνίες και ώρες αρχειοθέτησης ενός ιστότοπου. Κάντε κλικ στον σύνδεσμο για να δείτε τον ιστότοπο "στο παρελθόν".
Στα ακόλουθα παραδείγματα, μπορείτε να δείτε την πρώτη σελίδα του ιστότοπου της Apple που καταγράφηκε τον Φεβρουάριο του 2005 και τον Νοέμβριο του 2014, καθώς και την αρχική σελίδα του CNN από μια ημερομηνία του Μαρτίου 2004 και του Σεπτεμβρίου 2010.
Σημείωση: Αυτές οι ανιχνεύσεις περιλαμβάνουν επίσης συνδέσμους προς άλλες σελίδες όπως καταγράφονται στις δεδομένες ημερομηνίες και όχι μόνο στις αρχικές σελίδες.
Προηγμένα εργαλεία
Δημιουργήθηκε για ερευνητές και το κοινό, το Wayback Machine διαθέτει μερικά ενσωματωμένα εργαλεία που μπορεί να χάσουν οι απλοί χρήστες. Για παράδειγμα, από τη σχεδίαση, οι σελίδες αποτελεσμάτων αναζήτησης είναι εύκολο να αναφερθούν. Όπως εξηγήθηκε, "Εάν βρείτε μια αρχειοθετημένη σελίδα που θέλετε να αναφέρετε στην ιστοσελίδα σας ή σε ένα άρθρο, μπορείτε να αντιγράψετε τη διεύθυνση URL. Μπορείτε ακόμη και να χρησιμοποιήσετε ασαφή αντιστοίχιση διευθύνσεων URL και προδιαγραφές ημερομηνίας… αλλά αυτό είναι λίγο πιο προηγμένο. "
Το Wayback Machine επιτρέπει επίσης στους ιδιοκτήτες ιστότοπων να χρησιμοποιούν τη λειτουργία "Αποθήκευση σελίδας τώρα" για να αποθηκεύσουν μια συγκεκριμένη σελίδα. Και όμως, δεν είναι τέλειο. Προς το παρόν, η λειτουργία δεν προσθέτει τη διεύθυνση URL του ιστότοπου σε μελλοντικές ανιχνεύσεις. Επιπλέον, το αίτημα δεν αποθηκεύει περισσότερες από μία σελίδες. Ωστόσο, είναι ένα καλό πρώτο βήμα για να αρχειοθετήσετε την αρχική σελίδα του ιστότοπού σας για το ιστορικό αρχείο.
Δεν χρειάζεται να επισκέπτεστε το Wayback Machine κάθε φορά για να κάνετε μια νέα αναζήτηση. Αντ 'αυτού, μπορείτε να βρείτε περιεχόμενο πληκτρολογώντας τη διεύθυνση στη γραμμή εργαλείων του προγράμματος περιήγησης ιστού. Χρησιμοποιήστε αυτήν τη μορφή για όλες τις αναζητήσεις: http://web.archive.org/*/www.yoursite.com/*. Για παράδειγμα, χρησιμοποιήστε http://web.archive.org/*/www.groovypost.com/* για να βρείτε αρχειοθετημένες σελίδες για το GroovyPost!
Εργαλεία για κινητά και προγραμματιστές
Τέλος, το Wayback Machine δεν βρίσκεται μόνο στον ιστό. Μπορείτε να βρείτε μια εφαρμογή Wayback Machine για iOS και Android. Υπάρχουν επίσης επεκτάσεις για Chrome, Safari και Firefox. Οι προγραμματιστές θα θέλουν επίσης να ρίξουν μια ματιά στο Internet Archive Wayback Machine APIs. Αυτά διευκολύνουν τους προγραμματιστές να ανακτούν πληροφορίες σχετικά με τα δεδομένα λήψης Wayback.
Το Internet Archive Wayback Machine υποστηρίζει πολλά διαφορετικά API. Με αυτόν τον τρόπο, διευκολύνει τους προγραμματιστές να ανακτούν πληροφορίες σχετικά με τα δεδομένα λήψης Wayback.
Η επιστροφή στο παρελθόν για τους αγαπημένους σας ιστότοπους είναι ο νούμερο 1 λόγος να επισκεφτείτε το Wayback Machine. Είναι επίσης ένα εξαιρετικό εργαλείο για όποιον ερευνά το ιστορικό ιστοτόπων για σχολικά έργα ή επιχειρηματική χρήση. Ό, τι κι αν κάνετε, επισκεφθείτε το Wayback Machine και δείτε τι μπορείτε να ανακαλύψετε με λίγα απλά βήματα.
Για περισσότερες πληροφορίες σχετικά με τη συνδρομητική υπηρεσία Archive-It του Internet Archive, επισκεφθείτε τη διεύθυνση επίσημη ιστοσελίδα και αρχίστε να συνεισφέρετε σήμερα!