Jak wejść na stronę, która już nie istnieje?steemCreated with Sketch.

in polish •  7 years ago  (edited)

Wyobraź sobie sytuację, że kupujesz coś w sklepie internetowym. Ot, znalazłeś obudowę na telefon o której śniła po nocach Twoja młodsza siostrzyczka. Tylko że znalazłeś ją w małym, dość topornie wykonanym sklepie. Zapala się czerwona lampka. Ostatecznie chęć spełnienia marzenia młodej wygrywa i kupujesz obudowę.
Mija tydzień.
Mija drugi.
Myślisz sobie: no Święta, ludzie prezenty masowo kupują.
Zaczyna mijać trzeci, a na Poczcie Polskiej numer przesyłki który podajesz okazuje się być ciągiem znaków wygenerowanych przez kota wpuszczonego na klawiaturę. Takiego tresowanego, bo zgrabnie omijał znaki specjalne.
Irytujesz się. Wchodzisz na stronę sklepu. Wita Cię zimny, czarny napis: 404.
Nie pamiętasz nazwy, nie pamiętasz adresu sklepu, żadnych danych, które mogłyby pomóc rozwiązać tę sprawę.
Albo strona działa, ale Regulamin został nieco zmieniony.

Tutaj przychodzi z pomocą archiwizacja internetu.

Wayback Machine

Wayback Machine jest projektem mającym na celu zachowanie “dziedzictwa” Internetu.
To inicjatywa Internet Archive, organizacji non-profit (o której szerzej napiszę innym razem); cyfrowe archiwum, które przechowuje kopie stron internetowych.
W jaki sposób gromadzone są zrzuty stron?
Wayback Machine wpuszcza w Sieć tak zwane crawlery, czyli programy (boty) poruszające się po hiperlinkowej strukturze Internetu i zbierające w ten sposób strony do archiwizowania.
Aktualnie w bazie znajdziemy około 350 miliardów stron internetowych. W zależności od popularności strony Wayback Machine zaserwuje nam zrzuty z różnych okresów czasowych.

dukaj1.png
[przykład osi czasu zrzutów ze strony dukaj.pl]


Dukaj2.png
[i widok zarchiwizowanej przez Wayback strony]

Jak skorzystać z tego cudnego narzędzia?
Wpisujemy adres strony, wybieramy rok i szukamy niebieskich kropek na kalendrzu który się pokaże, licząc, że strona była zarchiwizowana w okresie który nas interesuje.
Niestety Wayback nie oferuje możliwości przeszukiwania archiwum po tekście który ukazał się na stronie, więc bez znajomości URLa nic nie zdziałamy.

Ja skorzystałam z archiwizacji chcąc dotrzeć do tekstów publicystycznych Jacka Dukaja na stronie pisarza po tym, jak uruchomiono nowy, bardzo ładny i nowoczesny, ale wyprany z zasobów layout.

Internet nie zapomina.

Wayback Machine można traktować jako ciekawostkę, ale też potężne narzędzie do wygrzebywania z Internetu wartościowych informacji.
Bo sieć kryje w sobie wiele zasobów, co będę udowadniać w kolejnych wpisach.

Authors get paid when people like you upvote their post.
If you enjoyed what you read here, create your account today and start earning FREE STEEM!
Sort Order:  

Trzeba było napisać o Google Cache :P

O Google Cache będzie innym razem, przy okazji szerszego przeglądu funkcji wyszukiwarki i usług Google
Takie zboczenie, lubię wyciągać na wierzch te mniej znane rozwiązania. :P

Congratulations @kaysh! You have completed some achievement on Steemit and have been rewarded with new badge(s) :

Award for the number of upvotes received

Click on any badge to view your own Board of Honor on SteemitBoard.
For more information about SteemitBoard, click here

If you no longer want to receive notifications, reply to this comment with the word STOP

By upvoting this notification, you can help all Steemit users. Learn how here!

Ta strona wiele razy mi pomogła, gdy już jakaś treść wyparowała ze strony. Polecam każdemu.

Tak z ciekawości, słyszałaś o IPFS? Polecam zobaczyć:

Nie słyszałam. Ale chętnie obejrzę, dzięki!

powinienem od razu dopisać (ale pisząc z telefonu mi się nie chciało :P)

IPFS, to nowy eksperymentalny protokół. Gdyby to on został wprowadzony zamiast http, wówczas w internecie naprawdę nigdy nic by nie ginęło.