Wayback Machine: відмінності між версіями

1308 байтів додано ,  1 рік тому
оформлення
м (→‎См. також: уточнення)
(оформлення)
 
== Історія ==
2001 року засновники [[Інтернет-архів]]у {{нп|Брюстер Кале||en|Brewster Kahle}} і {{нп|Брюс Джилліат||en|Bruce Gilliat}} запустили проект Wayback Machine, щоб розв'язати проблему зникнення контенту веб-сайтів кожного разущоразу, коли їх змінюють або закривають<ref>{{cite journal |last=Notess |first=Greg R. |date=March–April 2002 |title=The Wayback Machine: The Web's Archive |url= |journal=Online |volume=26 |pages=59–61 |via=EBSCOhost}}</ref>. Сервіс дозволяє користувачам переглядати архівні версії [[Веб-сторінка|веб-сторінок]], як вони змінювались з часом, які цейв архівархіві називаєназиваються «тривимірним індексом»<ref name="FAQ">{{Citation|title=Frequently Asked Questions|url=https://archive.org/about/faqs.php#The_Wayback_Machine|archiveurl=https://web.archive.org/web/20180918131957/https://archive.org/about/faqs.php#The_Wayback_Machine|deadurl=no|chapter=The Wayback Machine|access-date=September 18, 2018|archivedate=September 18, 2018}}</ref>. Кале і Джилліат створили машинусервіс, сподіваючись заархівувати весь інтернет і забезпечити «загальний доступ до всіх знань»<ref name=":0">{{Cite web|url=https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|title=20,000 Hard Drives on a Mission {{!}} Internet Archive Blogs|website=blog.archive.org|language=en-US|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20181020153727/https://blog.archive.org/2016/10/25/20000-hard-drives-on-a-mission/|archivedate=October 20, 2018|deadurl=no}}</ref>.
 
Назву ''Wayback Machine'' вибрали як посилання на пристрій для [[Подорож у часі|подорожей у часі]], який застосовують персонажі {{нп|Містер Пібоді||en|Mr. Peabody}} і Шерман в анімаційному фільмі ''{{нп|Шоу Роккі та Буллвінкля||en|The Rocky and Bullwinkle Show}}''<ref>{{Cite news|url=http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|title=A Library as Big as the World|last=Green|first=Heather|date=February 28, 2002|archiveurl=https://web.archive.org/web/20111220074306/http://www.businessweek.com/technology/content/feb2002/tc20020228_1080.htm|archivedate=December 20, 2011|publisher=BusinessWeek}}</ref><ref>{{Cite news|url=https://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|title=Responsible Party – Brewster Kahle; A Library Of the Web, On the Web|last=Tong|first=Judy|date=September 8, 2002|work=New York Times|accessdate=August 15, 2011|archiveurl=https://web.archive.org/web/20110220181725/http://www.nytimes.com/2002/09/08/business/responsible-party-brewster-kahle-a-library-of-the-web-on-the-web.html|archivedate=February 20, 2011|deadurl=no}}</ref> під назвою «{{iw|WABAC machine||}}» (вимовляється ''вей-бек''). В одній з частин цього анімаційного мультфільму, ''{{нп|Неймовірна історія Пібоді||en|Peabody's Improbable History}}'', персонажі за допомогою машини часто стають свідками відомих історичних подій, беруть в них участь і, здебільшого, змінюють їх хід.
 
У травні 1996 року Wayback Machine почала архівувати [[кеш]]овані веб-сторінки, з метою через п'ять років зробити послугу доступною громадськості<ref name="IA: Wayback">{{Cite web|url=https://archive.org/web/|title=Internet Archive: Wayback Machine|website=archive.org|language=en|accessdate=October 15, 2018|archiveurl=https://web.archive.org/web/20140103004344/http://archive.org/web/|archivedate=January 3, 2014|deadurl=no}}</ref>. Від 1996 до 2001 року інформація зберігалася на магнітних плівках, а Кале зрідка дозволяв дослідникам і науковцям підключатисяпід'єднуватись до громіздкої бази даних<ref>{{Cite news|last=Cook|first=John|title=Web site takes you way back in Internet history|url=http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|accessdate=August 15, 2011|work=Seattle Post-Intelligencer|date=November 1, 2001|deadurl=no|archiveurl=https://web.archive.org/web/20140812205508/http://www.seattlepi.com/news/article/Web-site-takes-you-way-back-in-Internet-history-1070534.php|archivedate=August 12, 2014}}</ref>. 2001 року, коли архівові виповнилося п'ять років, відбулась церемонія його відкрили длявідкриття громадськості під час церемонії в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі)<ref>{{cite journal |url=https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |title=Wayback Goes Way Back on Web |journal=Wired |author= |date=October 28, 2001 |accessdate=October 16, 2017 |deadurl=no |archiveurl=https://web.archive.org/web/20171016225914/https://www.wired.com/2001/10/wayback-goes-way-back-on-web/ |archivedate=October 16, 2017 |df= }}</ref>. ДоНа часучас запуску Wayback Machine вона вже містила понад 10 мільярдів архівнихархівованих сторінок<ref name="Arora (2015)" />.
 
Нині дані зберігаються на великому кластері обчислювальних вузлів [[Linux]] компанії Інтернет-архів<ref name=":0" />. Він час від часу заново відвідує і архівує нові версії веб-сайтів (див. технічні дані нижче)<ref name="leetaru" />. СайтиСторінки також можна архівувати вручну, вводячи їх [[Уніфікований локатор ресурсів|URL-адреси]] в поле пошуку, за умови, що вонивеб-сайти дозволяють пошуковому роботу Wayback Machine просканувати їх і зберегти дані<ref name="IA: Wayback" />.
 
== Технічні деталі ==
ПрограмнеWayback забезпеченняMachine розробленоза такимдопомогою чином, щобспеціального [[пошуковий робот|пошукового робота]] міг скануватисканує Інтернет і завантажуватизавантажує всі загальнодоступні веб-сторінки, ієрархію [[Gopher]], електронну дошку оголошень [[Usenet]], іа програмнетакож забезпеченнязавантажуване дляпрограмне завантаженнязабезпечення<ref name="ArchivingInternet">{{Cite web|last=Kahle|first=Brewster|title=Archiving the Internet|url=http://www.uibk.ac.at/voeb/texte/kahle.html|publisher=Scientific American – March 1997 Issue|accessdate=August 19, 2011|deadurl=no|archiveurl=https://web.archive.org/web/20120403042627/http://www.uibk.ac.at/voeb/texte/kahle.html|archivedate=April 3, 2012}}</ref>. Ці роботи можуть відсканувати не всю доступну в Інтернеті інформацію, оскільки значнудоступ частинудо значної частини даних обмежують власники сайтів, або ж ці дані зберігається в недоступних базах. Щоб подолати суперечностінеузгодженості частково кешованих веб-сайтів, 2005 року компанія Інтернет архів створила сайт Archive-It.org як засіб, що дозволяє установам і творцям контенту за власним бажанням збирати і зберігати колекціїзібрання цифрового контенту та створювати цифрові архіви<ref>{{Cite web|url=https://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|title=Archive-It: Crawling the Web Together|website=Internet Archive Blogs|last=Jeff Kaplan|date=October 27, 2014|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171012212827/http://blog.archive.org/2014/10/27/archive-it-crawling-the-web-together/|archivedate=October 12, 2017}}</ref>.
 
CrawlСканування надходять з різних джерел, деякі імпортуються від третіх сторін, тоді як інші генеруються всередині самого архівуАрхіву<ref name=leetaru/>. Наприклад, Crawlsсканування надходять від [[Фундація Альфреда Слоуна|Фундації Альфреда Слоуна]] і [[Alexa Internet|Alexa]], повзаєсканування веденнізроблені ІА від іменідля [[Національне управління архівів та документації|Національного управління архівів та документації]] та {{iw|Internet Memory Foundation||}}, дзеркал з {{iw|Common Crawl||}}<ref name="leetaru" />. «Worldwide Web Crawls» працює з 2010 року і захоплює глобальнесканує павутиннявсемережжя<ref name=":3">{{Cite web|url=https://archive.org/details/widecrawl&tab=about|title=Worldwide Web Crawls|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019222740/https://archive.org/details/widecrawl%26tab%3Dabout|archivedate=October 19, 2017}}</ref><ref name="leetaru" />.
 
Частота захопленьзроблених длязнімків зберіганнясторінок змінюється в залежності від веб-сайту<ref name=leetaru/>. Сайти у «Worldwide Web Crawls» включенівміщені в «crawlсписок listсканувань», один сайт архівується раз за обхідсканування<ref name="leetaru" />. ОбхідСканування може тривати кілька місяців або навіть років у залежності від розміру<ref name="leetaru" />. Наприклад, «Wide Crawl Number 13» розпочався 9 січня 2015 року й завершився 11 липня 2016 року<ref>{{Cite web|url=https://archive.org/details/wide00013?&sort=-publicdate&page=3|title=Wide Crawl Number 13|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019223332/https://archive.org/details/wide00013?&sort=-publicdate&page=3|archivedate=October 19, 2017}}</ref>. Однак, в один і той самий моментчас може проходитивідбуватись кілька обходівсканувань, і сайт може бути включенийвміщено ув понад один crawlсписок listсканувань, тож частота обходусканування сайтів змінюється в широких межах<ref name="leetaru">{{Cite web|url=https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|title=The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web|website=Forbes|last=Kalev Leetaru|date=January 28, 2016|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171016230439/https://www.forbes.com/sites/kalevleetaru/2016/01/18/the-internet-archive-turns-20-a-behind-the-scenes-look-at-archiving-the-web/#222f2e5682e0|archivedate=October 16, 2017}}</ref>.
 
=== Місткість сховища іта її зростання ===
Разом з розвитком технології впродовж років зростала й місткість сховища Wayback Machine. У 2003 році, через два роки після того, як доступ став публічним, Wayback Machine зростала зі швидкістю 12 терабайтів на місяць. Дані зберігаються на rackзробленій systemsна замовлення системі customстелажування [[PetaBox]], розробленій співробітниками інтернет-архіву. ПершаПерший стійкастелаж на 100ТВ повністю увійшлаувійшов ву дію в червні 2004 року, хоча невдовзі стало зрозуміло, що їм потрібно значно більше місця, ніж навона ніймістить<ref>{{Cite web|url=https://archive.org/web/petabox.php|title=Internet Archive: Petabox|website=archive.org|language=en|accessdate=October 25, 2018}}</ref><ref>{{Cite news|url=http://news.zdnet.com/2100-9584_22-5808754.html|title=Big storage on the cheap|last=Kanellos|first=Michael|date=July 29, 2005|accessdate=July 29, 2007|archiveurl=https://web.archive.org/web/20070403030705/http://news.zdnet.com/2100-9584_22-5808754.html <!-- Bot retrieved archive -->|archivedate=April 3, 2007|publisher=CNET News.com}}</ref>.
 
2009 року Інтернет-архів перевів свою клієнтськуспеціалізовану архітектуру зберігання вдо {{iw|Sun Open Storage||}}, і утримуємає у своїй власності новий центр обробки даних у {{iw|Sun Modular Datacenter}} у каліфорнійському кампусі [[Sun Microsystems]]<ref>{{Cite web|title=Internet Archive and Sun Microsystems Create Living History of the Internet|publisher=[[Sun Microsystems]]|date=March 25, 2009|url=http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|accessdate=March 27, 2009|deadurl=no|archiveurl=https://web.archive.org/web/20090326200212/http://www.sun.com/aboutsun/pr/2009-03/sunflash.20090325.1.xml|archivedate=March 26, 2009}}</ref>. {{Станом на|2009}} Wayback Machine містила приблизно три [[петабайт]]и даних і зростала зі швидкістю 100 [[терабайт]] на місяць<ref>{{Cite news|url=http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|title=Internet Archive to unveil massive Wayback Machine data center|last=Mearian|first=Lucas|date=March 19, 2009|accessdate=March 22, 2009|archiveurl=https://web.archive.org/web/20090323093002/http://www.computerworld.com/action/article.do?command=viewArticleBasic&taxonomyName=hardware&articleId=9130081&taxonomyId=12&intsrc=kc_top|archivedate=March 23, 2009|publisher=Computerworld.com}}</ref>.
 
Нова, поліпшена версія Wayback Machine, з оновленим інтерфейсом і свіжішимновішим індексомпокажчиком архівних матеріалів, стала доступною для публічного тестування у 2011 році<ref name="WordpressArchive">{{Cite web|title=Updated Wayback Machine in Beta Testing|url=http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|publisher=Archive.org|accessdate=August 19, 2011|deadurl=no|archiveurl=https://web.archive.org/web/20110823040310/http://iawebarchiving.wordpress.com/2011/01/24/updated-wayback-machine-in-beta-testing/|archivedate=August 23, 2011}}</ref>. У березні того самого року на форумі Wayback Machine було сказано, що «бета-версія нової Wayback Machine має повніший і актуальніший покажчик всіх обійденихвідсканованих матеріалів до 2010 року, й продовжить регулярно оновлюватися. Покажчик, який управляв старою Wayback Machine, має небагато матеріалів після 2008 року, і жодних його подальших оновлень не планується, оскільки йогоцього маютьроку згорнутийого цьогоприпинять рокувикористовувати»<ref>{{Cite web|url=https://www.archive.org/post/350738/updated-wayback-machine-in-beta-testing|title=Beta Wayback Machine, in forum|publisher=Archive.org|date=|accessdate=April 16, 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140417082107/https://archive.org/post/350738/updated-wayback-machine-in-beta-testing|archivedate=April 17, 2014}}</ref>. Також 2011 року інтернет-архів встановив свою шосту пару стійокстелажів PetaBox, що дозволило збільшити ємністьмісткість Wayback Machine на 700 терабайт<ref>{{Cite web|url=https://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|title=Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used|website=archive.org|language=en|accessdate=October 25, 2018|archiveurl=https://web.archive.org/web/20161024144627/http://archive.org/post/353721/6th-pair-of-racks-go-into-service-over-2pb-of-data-space-used|archivedate=October 24, 2016|deadurl=no}}</ref>.
 
У січні 2013 року, компанія оголосила про нову віху - 240 мільярдів відсканованих URL-адрес<ref>{{Cite web|url=http://blog.archive.org/2013/01/09/updated-wayback/|title=Wayback Machine: Now with 240,000,000,000 URLs &#124; Internet Archive Blogs|publisher=Blog.archive.org|date=January 9, 2013|accessdate=April 16, 2014|deadurl=no|archiveurl=https://web.archive.org/web/20140414221120/http://blog.archive.org/2013/01/09/updated-wayback/|archivedate=April 14, 2014}}</ref>. У жовтні 2013 року компанія оголосила про функціювведення функції «Save a Page»<ref name="ia-2013-10">{{Cite web|url=https://blog.archive.org/2013/10/25/fixing-broken-links/|title=Fixing Broken Links on the Internet|last=Rossi|first=Alexis|date=October 25, 2013|website=archive.org|publisher=Collections Team, the Internet Archive|location=San Francisco, CA, US|archiveurl=https://web.archive.org/web/20141107193437/http://blog.archive.org/2013/10/25/fixing-broken-links/|archivedate=November 7, 2014|deadurl=no|accessdate=March 25, 2015|quote=We have added the ability to archive a page instantly and get back a permanent URL for that page in the Wayback Machine. This service allows anyone – wikipedia editors, scholars, legal professionals, students, or home cooks like me – to create a stable URL to cite, share or bookmark any information they want to still have access to in the future.}}</ref>, якащо дозволяє будь-якомукористувачам користувачеві мережі ІнтернетІнтернету заархівувати вміст URL-адреси і швидко створює [[постійне посилання]] на відміну від попередньої функції ''liveweb''. Це стало загрозою зловживань з боку сервісу як {{нп|Drive-by download|хостингу шкідливих двійкових файлів|en|Drive-by download}}<ref name="vt-207-241">{{Cite web|url=https://www.virustotal.com/en/ip-address/207.241.226.190/information/|title=207.241.226.190 IP address information|last=The VirusTotal Team|date=March 25, 2015|website=virustotal.com|publisher=[[VirusTotal]]|location=Dublin 2, Ireland|archiveurl=https://web.archive.org/web/20140714232311/https://www.virustotal.com/en/ip-address/207.241.226.190/information/|archivedate=July 14, 2014|deadurl=no|accessdate=March 25, 2015|quote=2015-03-25: Latest URLs hosted in this IP address detected by at least one URL scanner or malicious URL dataset. ... 2/62 2015-03-25 16:14:12 [complete URL redacted]/Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [complete URL redacted]/CBLightSetup.exe}}</ref><ref name="goog-sb-ia1">{{Cite web|url=http://www.google.com/safebrowsing/diagnostic?site=archive.org|title=Safe Browsing Diagnostic page for archive.org|last=Advisory provided by Google|date=March 25, 2015|website=google.com/safebrowsing|publisher=[[Google]]|location=Mountain View, CA, US|deadurl=no|accessdate=March 25, 2015|quote=2015-03-25: Part of this site was listed for suspicious activity 138 time(s) over the past 90 days. ... What happened when Google visited this site? ... Of the 42410 pages we tested on the site over the past 90 days, 450 page(s) resulted in malicious software being downloaded and installed without user consent. The last time Google visited this site was on 2015-03-25, and the last time suspicious content was found on this site was on 2015-03-25. ... Malicious software includes 169 trojan(s), 126 virus, 43 backdoor(s).|archiveurl=https://web.archive.org/web/20150406101743/http://www.google.com/safebrowsing/diagnostic?site=archive.org|archivedate=April 6, 2015}}</ref>.
 
{{Станом на|2014|12}} Wayback Machine містила 435 мільярдів веб-сторінок обсягом майже дев'ять петабайтів, і зростала приблизно на 20 терабайтів щотижня<ref>{{Cite web|title=Internet Archive Frequently Asked Questions|url=https://archive.org/about/faqs.php|date=|accessdate=January 17, 2015|deadurl=no|archiveurl=https://web.archive.org/web/20091021003552/https://archive.org/about/faqs.php|archivedate=October 21, 2009}}</ref><ref name="Arora (2015)">{{cite journal |last=Arora |first=Sanjay K. |last2=Li |first2=Yin |last3=Youtie |first3=Jan |last4=Shapira |first4=Philip |date=May 5, 2015 |title=Using the wayback machine to mine websites in the social sciences: A methodological resource |journal=Journal of the Association for Information Science and Technology |language=en |volume=67 |issue=8 |pages=1904–1915 |doi=10.1002/asi.23503 |issn=2330-1635}}</ref><ref>{{Cite web|url=https://archive.org/about/faqs.php|archiveurl=https://web.archive.org/web/20141218203115/https://archive.org/about/faqs.php|deadurl=yes|archivedate=December 18, 2014|title=Internet Archive Frequently Asked Questions|date=December 18, 2014|accessdate=December 13, 2018}}</ref>.
 
Станом на вересень 2018 року Wayback Machine містила понад 25 петабайтів даних<ref>{{Cite news|url=https://thehustle.co/inside-wayback-machine-internet-archive|title=Inside Wayback Machine, the internet’s time capsule|last=Crockett|first=Zachary|date=September 28, 2018|work=The Hustle|accessdate=October 26, 2018|language=en-US|archiveurl=https://web.archive.org/web/20181002145800/https://thehustle.co/inside-wayback-machine-internet-archive|archivedate=October 2, 2018|deadurl=no}}</ref><ref>{{Cite news|url=https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|title=Things Break and Decay on the Internet—That's a Good Thing|last=Heffernan|first=Virginia|date=September 18, 2018|work=WIRED|accessdate=October 26, 2018|language=en-US|archiveurl=https://web.archive.org/web/20180925130510/https://www.wired.com/story/wired25-virginia-heffernan-internet-archive-wayback-machine/|archivedate=September 25, 2018|deadurl=no}}</ref>.
 
Станом на грудень 2020 року Wayback Machine містила понад 70 петабайтів даних<ref>{{cite web |url=https://blog.adafruit.com/2020/12/01/donate-to-the-internet-archive-digital-library-of-free-borrowable-books-movies-music-wayback-machine-internetarchive/ |title=Donate to the Internet Archive: Digital Library of Free & Borrowable Books, Movies, Music & Wayback Machine |publisher=adafruit |access-date=2 December 2020 |archive-date=December 2, 2020 |archive-url=https://web.archive.org/web/20201202065323/https://blog.adafruit.com/2020/12/01/donate-to-the-internet-archive-digital-library-of-free-borrowable-books-movies-music-wayback-machine-internetarchive/ |url-status=live }}</ref>.
 
=== Зростання ===
ВЗа період з жовтня 2013 року по березень 2015 року глобальнийв рейтингглобальному рейтингу Alexa сайтусайт Wayback Machine змінивсяопустився зі 163-го<ref name="alexa-2013-10">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Info|publisher=[[Alexa Internet]]|archiveurl=https://web.archive.org/web/20131028025923/http://www.alexa.com/siteinfo/archive.org|archivedate=October 28, 2013|deadurl=yes|accessdate=October 29, 2013}}</ref> дона 208-ме місце<ref name="alexa-2015-03">{{Cite web|url=http://www.alexa.com/siteinfo/archive.org|title=Archive.org Site Overview|publisher=Alexa Internet|archiveurl=https://web.archive.org/web/20150409101131/http://www.alexa.com/siteinfo/archive.org|archivedate=April 9, 2015|deadurl=yes<!-- set to yes, because the alexa page will show a new current rank, not the as-of-date rank, invalidating this reference. -->|accessdate=April 9, 2015}}</ref>. У березні 2019 рейтингсайт був на 244-му місці<ref>{{Cite web|url=https://web.archive.org/web/20190323051243/https://www.alexa.com/siteinfo/archive.org|title=Archive.org Traffic, Demographics and Competitors - Alexa|date=2019-03-23|website=web.archive.org|accessdate=2019-04-05}}</ref>.
 
{{Bar chart
}}
 
=== Політики виключеннявинятків сайтувеб-сайтів ===
Історично, Wayback Machine поважав стандарт винятків для роботів ([[Robots.txt]]), визначаючи, чиколи сайт можна обходити чи нісканувати; або ж, якщо вже робот його обійшов, то чи ці архіви будуть у відкритому доступі. Власники веб-сайту мають можливість відмовитисязробити його віднедоступним послугдля Wayback Machine за допомогою robots.txt. Правила robots.txt застосовуються заднім числом; якщо сайтвласник сайту заблокував для інтернет-архівархіву доступ до нього, то всі заархівовані раніше архівні сторінки з цього домену також негайноодразу ж стають недоступними. Крім того, впрацівники Internet Archive заявили, що «іноді власник сайту зв'язується з нами і просить нас зупинити сканування та архівацію сайту. Ми виконуємо ці запити»<ref>[https://web.archive.org/collections/web/faqs.html#exclusions Some sites are not available because of Robots.txt or other exclusions] {{webarchive |url=https://web.archive.org/web/20110415130934/http://web.archive.org/collections/web/faqs.html |date=April 15, 2011}}</ref>. НаКрім додатоктого, на сайті написано: «Інтернет-архів не зацікавлений у збереженні або наданні доступу доскануванні веб-сайту абота інших інтернет-документів, відабо осібнаданні доступу до них, якіякщо власники не хочуть, щоб їх матеріаливони були в зібранні.»<ref>[https://www.archive.org/about/faqs.php#2 How can I remove my site's pages from the Wayback Machine?] {{webarchive |url=https://web.archive.org/web/20140417122600/https://archive.org/about/faqs.php |date=April 17, 2014}}</ref><ref>{{Cite news|url=https://motherboard.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy|title=The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers|last=Cox|first=Joseph|date=May 22, 2018|accessdate=May 23, 2018|archiveurl=https://archive.is/20180522192132/https://motherboard.vice.com/en_us/article/nekzzq/wayback-machine-deleting-evidence-flexispy|archivedate=May 23, 2018|deadurl=no}}</ref>.
 
==== Оклендська архівна політика ====