Wayback Machine: відмінності між версіями

111 байтів додано ,  3 роки тому
→‎Історія: оформлення
[перевірена версія][перевірена версія]
(→‎Історія: оформлення)
<!-- | revenue = This parameter is more appropriate for the Internet Archive article. This article is only about the website. -->}}
 
'''Wayback Machine''' - цифровий [[архів]] з [[Всесвітнє павутиння|всесвітньоговсесвітньої павутинняпавутини]] та іншої інформації в [[Інтернет]]і. Його запустила 2001 року [[Інтернет-архівнеприбуткова організація]], під назвою [[неприбуткова організаціяІнтернет-архів]], що базується в [[Сан-Франциско]] ([[Каліфорнія]], [[Сполучені Штати Америки|США]]). {{toclimit|limit=3}}
 
== Історія ==
Засновники2001 року засновники [[Інтернет-архів]]у {{нп|Брюстер Кале||en|Brewster Kahle}} і {{нп|Брюс Джилліат||en|Bruce Gilliat}} запустили проект Wayback Machine 2001 року, щоб вирішити проблему зникнення контенту веб-сайтів кожного разу, коли їх змінюють або закривають<ref>{{cite journal |last=Notess |first=Greg R. |date=March–April 2002 |title=The Wayback Machine: The Web's Archive |url= |journal=Online |volume=26 |pages=59–61 |via=EBSCOhost}}</ref>. Сервіс дозволяє користувачам переглядати архівні версії [[Веб-сторінка|веб-сторінок]], як вони змінювались з часом, щоякі цей архів називає "тривимірним індексом"<ref name="FAQ">{{Citation|title=Frequently Asked Questions|url=https://archive.org/about/faqs.php#The_Wayback_Machine|archiveurl=https://web.archive.org/web/20180918131957/https://archive.org/about/faqs.php#The_Wayback_Machine|deadurl=no|chapter=The Wayback Machine|access-date=September 18, 2018|archivedate=September 18, 2018}}</ref>. Кале і Джилліат створили машину, сподіваючись заархівувати весь інтернет і забезпечити "загальний доступ до всіх знань"<ref name=":0">{{Cite web|url=https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|title=20,000 Hard Drives on a Mission {{!}} Internet Archive Blogs|website=blog.archive.org|language=en-US|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20181020153727/https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|archivedate=October 20, 2018|deadurl=no}}</ref>.
 
Назву ''Wayback Machine'' вибрали як посилання на "{{iw|WABAC machine||}}" (вимовляється ''вей-бек''), пристрій для [[Подорож у часі|подорожей у часі]], який застосовують персонажі {{нп|Містер Пібоді||en|Mr. Peabody}} і Шерман в анімаційному фільмі ''{{нп|Шоу Роккі та Буллвінкля||en|The Rocky and Bullwinkle Show}}''<ref>{{Cite news|url=http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|title=A Library as Big as the World|last=Green|first=Heather|date=February 28, 2002|archiveurl=https://web.archive.org/web/20111220074306/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|archivedate=December 20, 2011|publisher=BusinessWeek}}</ref><ref>{{Cite news|url=https://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|title=Responsible Party – Brewster Kahle; A Library Of the Web, On the Web|last=Tong|first=Judy|date=September 8, 2002|work=New York Times|accessdate=August 15, 2011|archiveurl=https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|archivedate=February 20, 2011|deadurl=no}}</ref> під назвою "{{iw|WABAC machine||}}" (вимовляється ''вей-бек''). В одній з частин цього анімаційного мультфільму, ''{{нп|Неймовірна історія Пібоді||en|Peabody's Improbable History}}'', персонажі часто використовуваввикористовують машину, щоб спостерігатибути відомісвідками подіївідомих вісторичних історіїподій, брати в них участь і, частіше, змінювати їх хід.
 
1996 року Wayback Machine почала архівувати [[кеш]]овані веб-сторінки 1996 року, з метою зробити послугу доступною громадськостічерез п'ять років позробити томупослугу доступною громадськості<ref name="IA: Wayback">{{Cite web|url=https://archive.org/web/|title=Internet Archive: Wayback Machine|website=archive.org|language=en|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20140103004344/http://archive.org/web/|archivedate=January 3, 2014|deadurl=no}}</ref>. Від 1996 до 2001 року інформація зберігалася на цифровихмагнітних плівках, а Кале зрідка дозволяв дослідникам і дослідникам і науковцям підключатися до громіздкої бази даних<ref>{{Cite news|last=Cook|first=John|title=Web site takes you way back in Internet history|url=http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|accessdate=August 15, 2011|work=Seattle Post-Intelligencer|date=November 1, 2001|deadurl=no|archiveurl=https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|archivedate=August 12, 2014}}</ref>. 2001 року, коли архівові виповнилося п'ять років, його відкрили для публікигромадськості напід час церемонії в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі)<ref>{{cite journal |url=https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |title=Wayback Goes Way Back on Web |journal=Wired |author= |date=October 28, 2001 |accessdate=October 16, 2017 |deadurl=no |archiveurl=https://web.archive.org/web/20171016225914/https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |archivedate=October 16, 2017 |df= }}</ref>. До часу запуску Wayback Machine вона вже містила понад 10 мільярдів архівних сторінок<ref name="Arora (2015)" />.
 
Нині дані зберігаються на великому кластері обчислювальних вузлів [[Linux]] компанії Інтернет-архівуархів<ref name=":0" />. Він час від часу заново відвідує і архівує нові версії веб-сайтів випадково (див. технічні дані нижче)<ref name="leetaru" />. Сайти також можна архівувати вручну, вводячи йогоїх [[Уніфікований локатор ресурсів|URL-адресуадреси]] в поле пошуку, за умови, що сайтвони дозволяєдозволяють пошуковому роботу Wayback Machine "проковзати" по ньому пошуковимпросканувати роботомїх і зберегти дані<ref name="IA: Wayback" />.
 
== Технічні подробицідеталі ==
Програмне забезпечення розроблено таким чином, щоб [[пошуковий робот]] міг "проковзувати"сканувати по ІнтернетуІнтернет і завантажувати всі загальнодоступні веб-сторінки, ієрархію [[Gopher]], системуелектронну дошкидошку оголошень [[Usenet]] і завантажуване програмне забезпечення для завантаження<ref name="ArchivingInternet">{{Cite web|last=Kahle|first=Brewster|title=Archiving the Internet|url=http://www.uibk.ac.at/voeb/texte/kahle.html|publisher=Scientific American – March 1997 Issue|accessdate=August 19, 2011|deadurl=no|archiveurl=https://web.archive.org/web/20120403042627/http://www.uibk.ac.at/voeb/texte/kahle.html|archivedate=April 3, 2012}}</ref>. Інформація,Ці зібранароботи заможуть допомогою цих роботіввідсканувати не включає всю доступну інформацію в Інтернеті інформацію, оскільки значну частину даних обмежують видавцівласники сайтів, або вонаці дані зберігається в недоступних базах даних. Щоб подолати суперечності частково кешованих веб-сайтів, 2005 року компанія Інтернет архів розробивстворила сайт Archive-It.org як засіб, що дозволяє установам і творцям контенту добровільноза власним бажанням збирати і зберігати колекції цифрового контенту та створювати цифрові архіви<ref>{{Cite web|url=https://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|title=Archive-It: Crawling the Web Together|website=Internet Archive Blogs|last=Jeff Kaplan|date=October 27, 2014|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171012212827/http://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|archivedate=October 12, 2017}}</ref>.
 
CrawlsCrawl надходять з різних джерел, деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого архіву<ref name=leetaru/>. Наприклад, Crawls надходять від [[Фундація Альфреда Слоуна|Фундації Альфреда Слоуна]] і [[Alexa Internet|Alexa]], повзає веденні ІА від імені [[Національне управління архівів та документації|Національного управління архівів та документації]] та {{iw|Internet Memory Foundation||}}, дзеркал з {{iw|Common Crawl||}}<ref name="leetaru" />. "Worldwide Web Crawls" працює з 2010 року і захоплює глобальне павутиння<ref name=":3">{{Cite web|url=https://archive.org/details/widecrawl&tab=about|title=Worldwide Web Crawls|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019222740/https://archive.org/details/widecrawl%26tab%3Dabout|archivedate=October 19, 2017}}</ref><ref name="leetaru" />.
 
Частота захоплень для зберігання змінюється в залежності від сайту<ref name=leetaru/>. Сайти у "Worldwide Web Crawls" включені в "crawl list", один сайт архівується раз за обхід<ref name="leetaru" />. Обхід може тривати кілька місяців або навіть років у залежності від розміру<ref name="leetaru" />. Наприклад, "Wide Crawl Number 13" розпочався 9 січня 2015 року й завершився 11 липня 2016 року<ref>{{Cite web|url=https://archive.org/details/wide00013?&sort=-publicdate&page=3|title=Wide Crawl Number 13|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019223332/https://archive.org/details/wide00013?&sort=-publicdate&page=3|archivedate=October 19, 2017}}</ref>. Однак, в один і той самий момент може проходити кілька обходів, і сайт може бути включений у понад один crawl list, тож частота обходу сайтів змінюється в широких межах<ref name="leetaru">{{Cite web|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|title=The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web|website=Forbes|last=Kalev Leetaru|date=January 28, 2016|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016230439/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|archivedate=October 16, 2017}}</ref>.