Wayback Machine: відмінності між версіями

[перевірена версія][перевірена версія]
Вилучено вміст Додано вміст
м →‎Використання: оформлення
Немає опису редагування
Рядок 17:
2001 року засновники [[Інтернет-архів]]у {{нп|Брюстер Кале||en|Brewster Kahle}} і {{нп|Брюс Джилліат||en|Bruce Gilliat}} запустили проект Wayback Machine, щоб розв'язати проблему зникнення контенту веб-сайтів щоразу, коли їх змінюють або закривають<ref>{{cite journal |last=Notess |first=Greg R. |date=March–April 2002 |title=The Wayback Machine: The Web's Archive |url= |journal=Online |volume=26 |pages=59–61 |via=EBSCOhost}}</ref>. Сервіс дозволяє користувачам переглядати архівні версії [[Веб-сторінка|веб-сторінок]], як вони змінювались з часом, які в архіві називаються «тривимірним індексом»<ref name="FAQ">{{Citation|title=Frequently Asked Questions|url=https://archive.org/about/faqs.php#The_Wayback_Machine|archiveurl=https://web.archive.org/web/20180918131957/https://archive.org/about/faqs.php#The_Wayback_Machine|deadurl=no|chapter=The Wayback Machine|access-date=September 18, 2018|archivedate=September 18, 2018}}</ref>. Кале і Джилліат створили сервіс, сподіваючись заархівувати весь інтернет і забезпечити «загальний доступ до всіх знань»<ref name=":0">{{Cite web|url=https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|title=20,000 Hard Drives on a Mission {{!}} Internet Archive Blogs|website=blog.archive.org|language=en-US|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20181020153727/https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|archivedate=October 20, 2018|deadurl=no}}</ref>.
 
Назву ''Wayback Machine'' вибрали як посилання на пристрій для [[Подорож у часі|подорожей у часі]], який застосовують персонажі {{нп|Містер Пібоді||en|Mr. Peabody}} і Шерман в анімаційному фільмі ''{{нп|Шоу Роккі та Буллвінкля||en|The Rocky and Bullwinkle Show}}''<ref>{{Cite news|url=http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|title=A Library as Big as the World|last=Green|first=Heather|date=February 28, 2002|archiveurl=https://web.archive.org/web/20111220074306/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|archivedate=December 20, 2011|publisher=BusinessWeek}}</ref><ref>{{Cite news|url=https://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|title=Responsible Party – Brewster Kahle; A Library Of the Web, On the Web|last=Tong|first=Judy|date=September 8, 2002|work=New York Times|accessdate=August 15, 2011|archiveurl=https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|archivedate=February 20, 2011|deadurl=no}}</ref> під назвою «{{iw|WABAC machine||}}» (вимовляється ''вей-бек''). В одній з частин цього анімаційного мультфільму, ''{{нп|Неймовірна історія Пібоді||en|Peabody's Improbable History}}'', персонажі за допомогою машини часу часто стають свідками відомих історичних подій, беруть в них участь і, здебільшого, змінюють їхїхній хідперебіг.
 
У травні 1996 року Wayback Machine почала архівувати [[кеш]]овані веб-сторінки, з метою через п'ять років зробити послугу доступною громадськості<ref name="IA: Wayback">{{Cite web|url=https://archive.org/web/|title=Internet Archive: Wayback Machine|website=archive.org|language=en|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20140103004344/http://archive.org/web/|archivedate=January 3, 2014|deadurl=no}}</ref>. Від 1996 до 2001 року інформація зберігалася на магнітних плівках, а Кале зрідка дозволяв дослідникам і науковцям під'єднуватись до громіздкої бази даних<ref>{{Cite news|last=Cook|first=John|title=Web site takes you way back in Internet history|url=http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|accessdate=August 15, 2011|work=Seattle Post-Intelligencer|date=November 1, 2001|deadurl=no|archiveurl=https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|archivedate=August 12, 2014}}</ref>. 2001 року, коли архівові виповнилося п'ять років, відбулась церемонія його відкриття громадськості в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі)<ref>{{cite journal |url=https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |title=Wayback Goes Way Back on Web |journal=Wired |author= |date=October 28, 2001 |accessdate=October 16, 2017 |deadurl=no |archiveurl=https://web.archive.org/web/20171016225914/https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |archivedate=October 16, 2017 |df= }}</ref>. На час запуску Wayback Machine вона вже містила понад 10 мільярдів архівованих сторінок<ref name="Arora (2015)" />.
Рядок 92:
 
=== Обмеження ===
Попри свої можливості, Wayback Machine також має деякі обмеження. У 2014 році затримка між скануванням вмісту сайтів і часом, коли він був доступним на Wayback Machine, становила шість місяців<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|last=|first=|date=April 2, 2014|website=Internet Archive|archiveurl=https://web.archive.org/web/20140402223358/https://archive.org/about/faqs.php|archivedate=2014-04-02|deadurl=yes|accessdate=November 23, 2018}}</ref>. Станом на листопад 2018 року час затримки становив від 3 до 10 годин<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=November 23, 2018}}</ref>. Wayback Machine не є «історичним Google»; користувачі самі мають знати URL-адреси веб-сайтів, які вони хочуть переглянути<ref name=":4" />. ВонаІснує має функціюфункція «Site Search» (пошук сайту), яка дозволяє користувачам знайти сайт на основі слів, що описують сайт, а не слів, знайдених на самих веб-сторінках<ref name=":4" />.
 
Wayback Machine не містить усіх сторінок, коли-небудь створених, через обмеження свого веб-краулера. Wayback Machine не може повністю архівувати веб-сторінки, які містять інтерактивні функції, такі як-от Флеш-платформи і форми, написані на JavaScript, бо ці функції вимагають взаємодії з хост-сайтом. Веб-краулеркраулеру маєскладно тружнощівідсканувати з витягуванням усьоговсе, що закодовано не в HTML (або одному з його варіантів), що часто призводить до зламаних гіперпосилань та відсутніх зображень. КрімЧерез того,це веб-краулер не архівує «сторінок-сиріт», які не містять посилань на інші сторінки<ref name=":2">{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=October 18, 2018|archiveurl=https://web.archive.org/web/20130420213122/http://archive.org/about/faqs.php|archivedate=April 20, 2013|deadurl=no}}</ref><ref name=":4">{{cite journal |last=Bates |first=Mary Ellen |date=2002 |title=The Wayback Machine |url= |journal=Online |volume=26 |pages=80 |via=EBSCOhost}}</ref>. Конкретні правила, що регулюють краулерКраулер Wayback Machine, можутьможе дослідитивідсканувати лише наперед визначену кількість гіперпосилань, ґрунтуючисьзгідно наз наперед заданомузаданим обмеженніобмеженням глибини, тому він не може архівуватизаархівувати всі гіперпосилання на кожній сторінці<ref name=":3" />.
 
Деякі власники поміщають на свій сайт файл robot.txt, який не дозволяє Wayback Machine знаходити та архівувати їх. Крім того, власники веб-сайтів також можуть безпосередньо зв'язатися з Інтернет-архівом і просити, щоб їх сторінки було вилучено з архіву<ref name=":2" />.
Рядок 103:
 
===== Netbula LLC проти Chordiant Software Inc. =====
У справі 2009 року ''Netbula, LLC проти Chordiant Software Inc'' відповідач Chordiant подав клопотання, щоб Netbula на своєму сайті вимкнула файл [[robots.txt]], який змушував Wayback Machine заднім числом закривати доступ до попередніх версій сторінок, заархівованих з сайту Netbula, які, на думку Chordiant могли б підтриматисвідчити їїна справукористь захисту<ref name="howard_lloyd"/>.
 
Netbula заперечила проти цього клопотання на тій підставі, що відповідач зверталисязвертався з проханням змінити сайт Netbula, іа щойому вінслід мав бибуло безпосередньо звернутисязробити запит до Архіву ІнтернетуІнтернет-архіву за сторінкамидоступом до заархівованих сторінок<ref name="antonio_cortes">{{Cite web|last=Cortes|first=Antonio|date=October 2009|title=Motion Opposing Removal of Robots.txt|url=http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE/|accessdate=October 15, 2009|deadurl=yes|archiveurl=https://web.archive.org/web/20101027050350/http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE|archivedate=жовтень 27, 2010}}</ref>. Проте, співробітник Інтернет-архіву подав заяву під присягою, якоюв якій підтримав дію Chordiant, заявивши, що він не може видати веб-сторінки за допомогою інших засобів «без значного навантаження, витрат і перебоїв у його роботі»<ref name="howard_lloyd"/>.
 
Суддя Говард Ллойд у Північному окрузі Каліфорнії, відділі Сан-Хосе, відхилив доводизаперечення Netbula і наказав їмйому тимчасово вимкнути блокування robots.txt для того, щоб Chordiant отрималиотримав архівні сторінки, які їм були потрібні<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=October 15, 2009}}</ref>.
 
===== Telewizja Polska =====
У жовтні 2004 року у справі ''[[TVP|Telewizja Polska USA, Inc.]] проти Echostar Satellite'', No. 02&nbsp;°C 3293, 65 Fed. R. Evid. Serv. 673 (N.D. Ill. October 15, 2004), позивач, мабуть вперше в історії, намагався використати Wayback Machine як джерело допустимих доказів, мабуть, вперше. КомпаніїКомпанія Telewizja Polska є провайдером [[TVP Polonia]] і {{iw|EchoStar||}}, яка управляє [[Dish Network]]. До початку судового розгляду, EchoStar вказала, що має намір запропонувати знімки Wayback Machine як доказ минулого змісту сайту Telewizja Polska. КомпаніїКомпанія Telewizja Polska і подала ''{{нп|Клопотання inпро limineнерозголошення||en|Motion in limine}}'', щоб незавадити дативикористанню хід знімкамзнімків на тій підставі, що нібито це [[Свідчення з чужих слів|чутки]] і неперевірене джерело, але суддя Арландер, відхилив твердження Telewizja Polska, що нібито це чутки, й відмовив у клопотанні ''inпро limineнерозголошення'' щодо виключеннявилучення доказів уз судіпроцесу<ref name="gelman">{{cite journal |last=Gelman |first=Lauren |date=November 17, 2004 |title=Internet Archive's Web Page Snapshots Held Admissible as Evidence |journal=Packets |volume=2 |issue=3 |url=http://cyberlaw.stanford.edu/packets002728.shtml |accessdate=January 4, 2007 |archive-url=https://web.archive.org/web/20110430095339/http://cyberlaw.stanford.edu/packets002728.shtml |archive-date=April 30, 2011 |dead-url=no |df= }}</ref><ref name="howell">{{cite journal |last=Howell |first=Beryl A. |date=February 2006 |title=Proving Web History: How to use the Internet Archive |journal=Journal of Internet Law |pages=3–9 |url=http://www.strozfriedberg.com/files/Publication/fee98a34-d739-478b-a7db-6af37b757714/Presentation/PublicationAttachment/aae88469-9835-4fe4-ae5f-38637924314f/BAHPROVINGWEBHISTORY.pdf |archive-url=https://web.archive.org/web/20100705043226/http://www.strozfriedberg.com/files/Publication/fee98a34-d739-478b-a7db-6af37b757714/Presentation/PublicationAttachment/aae88469-9835-4fe4-ae5f-38637924314f/BAHPROVINGWEBHISTORY.pdf |dead-url=yes |archive-date=July 5, 2010 |format=PDF |accessdate=August 6, 2008}}</ref>.
 
==== Патентне право ====
За умови виконання деяких додаткових вимог (наприклад, надання авторитетної заяви архіваріусаархівіста), {{нп|Відомство з патентів і торгових знаків США||en|United States patent office}} і {{нп|Європейське патентне відомство||en|European Patent Office}} приймають date stamps від Інтернет-архіву відмітки часу як доказ того, коли ця веб-сторінка була доступна громадськості. Ці дані використовуються для визначення, чи веб-сторінкасторінку доступнаможна яквважати [[Патентний пошук|prior art]], наприклад, під час розгляду заявки на патент<ref>{{Cite web|title=Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?|last=Wynn W. Coggins|date=Fall 2002|url=http://www.uspto.gov/patents/resources/methods/aiplafall02paper.jsp|website=USPTO|deadurl=no|archiveurl=https://web.archive.org/web/20120921083344/http://www.uspto.gov/patents/resources/methods/aiplafall02paper.jsp|archivedate=September 21, 2012}}</ref>.
 
== Цензура та інші загрози ==
Станом на грудень 2016 року Archive.org {{нп|Інтернет-цензура в Китаї|заблокований у Китаї|en|Internet censorship in China}}<ref>{{Cite web|last=Conger|first=Kate|title=Backing up the history of the internet in Canada to save it from Trump|url=https://techcrunch.com/2016/12/08/backing-up-the-history-of-the-internet-in-canada-to-save-it-from-trump/|publisher=TechCrunch|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20161227100714/https://techcrunch.com/2016/12/08/backing-up-the-history-of-the-internet-in-canada-to-save-it-from-trump/|archivedate=December 27, 2016}}</ref><ref>{{Cite web|title=Where to find what's disappeared online, and a whole lot more: the Internet Archive|url=https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive|publisher=Public Radio International|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170328092846/https://www.pri.org/stories/2017-02-23/where-find-whats-disappeared-online-and-whole-lot-more-internet-archive|archivedate=March 28, 2017}}</ref>. <!--Після того, як сайт включив зашифрований протокол [[HTTPS]] Internet Archive повністю {{нп|Інтернет-цензура в Росії|заблоковано в Росії|en|Internet censorship in Russia}} у 2015 році<ref>{{Cite web|last=Chirgwin|first=Richard|title=There's no Wayback in Russia: Putin blocks Archive.org|url=https://www.theregister.co.uk/2015/09/01/russias_putin_blocks_archiveorg/|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20161007165431/http://www.theregister.co.uk/2015/09/01/russias_putin_blocks_archiveorg|archivedate=October 7, 2016}}</ref><ref>{{Cite web|title=Russia won’t go Wayback, blocks the Internet Archive|url=https://www.digitaltrends.com/web/russia-censors-wayback-machines-485-billion-archived-web-pages/|publisher=Digital Trends|accessdate=May 14, 2017|date=June 26, 2015|deadurl=no|archiveurl=https://web.archive.org/web/20160417125727/http://www.digitaltrends.com/web/russia-censors-wayback-machines-485-billion-archived-web-pages/|archivedate=April 17, 2016}}</ref><ref name="usn1"/>--->
 
Елісон Макріна, директордиректорка Library Freedom Project, зазначає, що «хоча бібліотекарі глибоко цінують недоторканість приватного життя, ми також рішуче виступаємо проти цензури»<ref name="usn1"/>.
 
Відомі рідкісніокремі випадки, коли сайт закрив онлайн-доступ до матеріалів, через які «за просто таквипадкові» поставили людей в небезпеку,люди вимкнутоопинились нау сайтінебезпеці<ref name="usn1"/>.
 
Серед інших загроз: стихійні лиха,<ref>{{Cite web|title=Help Us Keep the Archive Free, Accessible, and Reader Private {{!}} Internet Archive Blogs|url=https://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170521080543/http://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|archivedate=May 21, 2017}}</ref>, знищення (дистанційне або фізичне), маніпуляціюманіпуляція вмістом архіву (див. також: [[хакерська атака]], [[резервне копіювання]]), проблематичне авторське право<ref>{{Cite web|title=Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"|url=https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|publisher=Consumerist|accessdate=May 14, 2017|date=June 7, 2016|deadurl=no|archiveurl=https://web.archive.org/web/20161111161239/https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|archivedate=November 11, 2016}}</ref> і спостереження за користувачами сайту<ref>{{Cite web|last=Herb|first=Ulrich|title=Die Trump-Angst grassiert|url=https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|publisher=heise online|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20161207164413/https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|archivedate=December 7, 2016}}</ref>.
 
Кевін Воен підозрює, що в довгостроковій перспективі декількохбагатьох поколінь «безціньмайже нічого» виживутьне кориснимзалишиться способомтакого, крімщоб «Якщоцим уможна насбуло єпрактично наступністьскористатись, уале «якщо збережеться наступність нашої технологічної цивілізації», за якимто «великазначну частину голих голоюданих даніможна залишатьсябуде виявитизнайти ій пошукудослідити»<ref>{{Cite web|last=LaFrance|first=Adrienne|title=The Internet's Dark Ages|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|publisher=The Atlantic|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|archivedate=May 7, 2017}}</ref>.
 
Деякі [хто?] знаходить,Власники Інтернет-архівархіву заявляють, якийщо описуєвін себепобудований якз побудованийрозрахунком на довгостроковутривалу перспективу<ref>{{Cite web|title=The Entire Internet Will Be Archived In Canada to Protect It From Trump|url=https://motherboard.vice.com/en_us/article/the-entire-internet-will-be-archived-in-canada-to-protect-it-from-trump|publisher=Motherboard|accessdate=May 14, 2017|language=en-us|deadurl=no|archiveurl=https://web.archive.org/web/20170516221604/https://motherboard.vice.com/en_us/article/the-entire-internet-will-be-archived-in-canada-to-protect-it-from-trump|archivedate=May 16, 2017}}</ref>. працює несамовитоВтім, щобавтори захопитистатті у журналі [[The Atlantic]] описують його роботу як "несамовите намагання вихопити дані, перш ніж вони зникнуть, безне будьмаючи для цього якоїсь більш-якоїменш надійної довгостроковоїтривалої інфраструктури<ref>{{Cite web|last=LaFrance|first=Adrienne|title=The Human Fear of Total Knowledge|url=https://www.theatlantic.com/technology/archive/2016/06/knowledge-compendia/485507/|publisher=The Atlantic|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20161202040113/http://www.theatlantic.com/technology/archive/2016/06/knowledge-compendia/485507/|archivedate=December 2, 2016}}</ref>.
 
== Див. також ==