Wayback Machine: відмінності між версіями

м (замінено закодовану відсотковим кодуванням частину URL-адреси на звичайні літери)
 
== Технічні деталі ==
Wayback Machine за допомогою спеціального [[пошуковий робот|пошукового робота]] сканує Інтернет і завантажує всі загальнодоступні веб-сторінки, ієрархію [[Gopher]], електронну дошку оголошень [[Usenet]], а також завантажуване [[програмне забезпечення]]<ref name="ArchivingInternet">{{Cite web|last=Kahle|first=Brewster|title=Archiving the Internet|url=http://www.uibk.ac.at/voeb/texte/kahle.html|publisher=Scientific American – March 1997 Issue|accessdate=August 19, 2011|deadurl=no|archiveurl=https://web.archive.org/web/20120403042627/http://www.uibk.ac.at/voeb/texte/kahle.html|archivedate=April 3, 2012}}</ref>. Ці роботи можуть відсканувати не всю доступну в Інтернеті інформацію, оскільки доступ до значної частини даних обмежують власники сайтів, або ж ці дані зберігається в недоступних базах. Щоб подолати неузгодженості частково кешованих веб-сайтів, 2005 року компанія Інтернет архів створила сайт Archive-It.org як засіб, що дозволяє установам і творцям контенту за власним бажанням збирати і зберігати зібрання цифрового контенту та створювати цифрові архіви<ref>{{Cite web|url=https://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|title=Archive-It: Crawling the Web Together|website=Internet Archive Blogs|last=Jeff Kaplan|date=October 27, 2014|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171012212827/http://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|archivedate=October 12, 2017}}</ref>.
 
Сканування надходять з різних джерел, деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого Архіву<ref name=leetaru/>. Наприклад, сканування надходять від [[Фундація Альфреда Слоуна|Фундації Альфреда Слоуна]] і [[Alexa Internet|Alexa]], сканування зроблені ІА для [[Національне управління архівів та документації|Національного управління архівів та документації]] та {{iw|Internet Memory Foundation||}}, дзеркал {{iw|Common Crawl||}}<ref name="leetaru" />. «Worldwide Web Crawls» працює з 2010 року і сканує всемережжя<ref name=":3">{{Cite web|url=https://archive.org/details/widecrawl&tab=about|title=Worldwide Web Crawls|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019222740/https://archive.org/details/widecrawl%26tab%3Dabout|archivedate=October 19, 2017}}</ref><ref name="leetaru" />.
Коли Wayback Machine архівує сторінку, вона зазвичай вміщує більшість гіперпосилань, зберігаючи ці посилання активними, коли вони запросто могли бути порушені нестабільністю Інтернету. Індійські вчені вивчали здатність Wayback Machine зберігати гіперпосилання в наукових онлайн-публікаціях і визначили, що вона зберігає трохи більш як половину з них<ref>{{cite journal |last=Sampath Kumar |first=B.T. |last2=Prithviraj |first2=K.R. |date=October 21, 2014 |title=Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs |journal=Journal of Information Science |language=en |volume=41 |issue=1 |pages=71–81 |doi=10.1177/0165551514552752 |issn=0165-5515}}</ref>.
 
Журналісти використовують Wayback Machine, щоб переглядати мертві сайти, застарілі новини і зміни в змісті сайту. Його зміст використовують, щоб притягати політиків до відповідальності й викривати брехню в зображенні подій на полі бою<ref name="usn1">{{Cite web|url=https://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|title=Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed|archiveurl=https://web.archive.org/web/20170106151933/http://www.usnews.com/news/articles/2016-08-17/wayback-machine-wont-censor-archive-for-taste-director-says-after-olympics-article-scrubbed|archivedate=January 6, 2017|deadurl=no|accessdate=May 14, 2017}}</ref>. 2014 року заархівована з соціальної мережі сторінка [[Гіркін Ігор Всеволодович|Ігоря Гіркина]] засвідчила як він хвалиться, що його бійці збили нібито український військовий літак. Коли ж стало відомо, що [[Збиття Boeing 777 біля Донецька|насправді це цивільний літак Малайзійських авіаліній]], Гіркін видалив пост і звинуватив українських військових у знищенні літака<ref name="usn1" /><ref>{{Cite web|title=What the Web Said Yesterday|url=http://www.newyorker.com/magazine/2015/01/26/cobweb|publisher=The New Yorker|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20150125141230/http://www.newyorker.com/magazine/2015/01/26/cobweb|archivedate=January 25, 2015}}</ref>. [[Марш за науку]] в березні 2017 року розпочався з обговорення на [[Reddit]], яке показало, що хтось відвідав Archive.org і виявив, що з сайту [[Білий дім|Білого дому]] вилучено всі посилання на [[Зміна клімату|зміну клімату]]. У відповідь один з користувачів написав: «Має бути хода науковців на Вашингтон»<ref>{{Cite web|title=The March for Science began with this person's 'throwaway line' on Reddit|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|publisher=Washington Post|accessdate=April 23, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170423081417/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/04/21/the-march-for-science-began-with-this-persons-throwaway-line-on-reddit/|archivedate=April 23, 2017}}</ref><ref name=":1">{{Cite web|url=https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|title=Are scientists going to march on Washington?|website=The Washington Post|accessdate=January 31, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170131152535/https://www.washingtonpost.com/news/speaking-of-science/wp/2017/01/24/are-scientists-going-to-march-on-washington/|archivedate=January 31, 2017}}</ref><ref>{{Cite web|last=Foley|first=Katherine Ellen|title=The global March for Science started with a single Reddit thread|url=https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|publisher=Quartz|accessdate=April 23, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170424004314/https://qz.com/965485/the-global-march-for-science-started-with-a-single-reddit-thread/|archivedate=April 24, 2017}}</ref>.
 
Крім того, сайт активно використовується для верифікації, забезпечуючи [[Вікіспільнота|редакторам Вікіпедії]] доступ до посилань і можливість створювати контент<ref>http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued</ref>.
Netbula заперечила проти цього клопотання на тій підставі, що відповідач звертався з проханням змінити сайт Netbula, а йому слід було безпосередньо зробити запит до Інтернет-архіву за доступом до заархівованих сторінок<ref name="antonio_cortes">{{Cite web|last=Cortes|first=Antonio|date=October 2009|title=Motion Opposing Removal of Robots.txt|url=http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE/|accessdate=October 15, 2009|deadurl=yes|archiveurl=https://web.archive.org/web/20101027050350/http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE|archivedate=жовтень 27, 2010}}</ref>. Проте, співробітник Інтернет-архіву подав заяву під присягою, в якій підтримав дію Chordiant, заявивши, що він не може видати веб-сторінки за допомогою інших засобів «без значного навантаження, витрат і перебоїв у його роботі»<ref name="howard_lloyd"/>.
 
Суддя Говард Ллойд у Північному окрузі [[Каліфорнія|Каліфорнії]], відділі [[Сан-Хосе (Каліфорнія)|Сан-Хосе]], відхилив заперечення Netbula і наказав йому тимчасово вимкнути блокування robots.txt для того, щоб Chordiant отримав архівні сторінки<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=October 15, 2009}}</ref>.
 
===== Telewizja Polska =====
 
==== Патентне право ====
За умови виконання деяких додаткових вимог (наприклад, надання авторитетної заяви архівіста), {{нп|Відомство з патентів і торгових знаків США||en|United States patent office}} і {{нп|Європейське патентне відомство||en|European Patent Office}} приймають від Інтернет-архіву відмітки часу як доказ того, коли ця веб-сторінка була доступна громадськості. Ці дані використовуються для визначення, чи веб-сторінку можна вважати [[Патентний пошук|prior art]], наприклад, під час розгляду заявки на [[патент]]<ref>{{Cite web|title=Prior Art in the Field of Business Method Patents – When is an Electronic Document a Printed Publication for Prior Art Purposes?|last=Wynn W. Coggins|date=Fall 2002|url=http://www.uspto.gov/patents/resources/methods/aiplafall02paper.jsp|website=USPTO|deadurl=no|archiveurl=https://web.archive.org/web/20120921083344/http://www.uspto.gov/patents/resources/methods/aiplafall02paper.jsp|archivedate=September 21, 2012}}</ref>.
 
== Цензура та інші загрози ==
Відомі окремі випадки, коли сайт закрив онлайн-доступ до матеріалів, через які «випадкові» люди опинились у небезпеці<ref name="usn1"/>.
 
Серед інших загроз: стихійні лиха<ref>{{Cite web|title=Help Us Keep the Archive Free, Accessible, and Reader Private {{!}} Internet Archive Blogs|url=https://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170521080543/http://blog.archive.org/2016/11/29/help-us-keep-the-archive-free-accessible-and-private/|archivedate=May 21, 2017}}</ref>, знищення (дистанційне або фізичне), маніпуляція вмістом архіву (див. також: [[хакерська атака]], [[резервне копіювання]]), проблематичне [[авторське право]]<ref>{{Cite web|title=Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"|url=https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|publisher=Consumerist|accessdate=May 14, 2017|date=June 7, 2016|deadurl=no|archiveurl=https://web.archive.org/web/20161111161239/https://consumerist.com/2016/06/07/internet-archive-proposed-changes-to-dmca-would-make-us-censor-the-web/|archivedate=November 11, 2016}}</ref> і спостереження за користувачами сайту<ref>{{Cite web|last=Herb|first=Ulrich|title=Die Trump-Angst grassiert|url=https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|publisher=heise online|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20161207164413/https://www.heise.de/tp/features/Die-Trump-Angst-grassiert-3549579.html|archivedate=December 7, 2016}}</ref>.
 
Кевін Воен підозрює, що в довгостроковій перспективі багатьох поколінь «майже нічого» не залишиться такого, щоб цим можна було практично скористатись, але «якщо збережеться наступність нашої технологічної цивілізації», то «значну частину голих даних можна буде знайти й дослідити»<ref>{{Cite web|last=LaFrance|first=Adrienne|title=The Internet's Dark Ages|url=https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|publisher=The Atlantic|accessdate=May 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170507173716/https://www.theatlantic.com/technology/archive/2015/10/raiders-of-the-lost-web/409210/|archivedate=May 7, 2017}}</ref>.
26

редагувань