Wayback Machine: відмінності між версіями

831 байт вилучено ,  3 роки тому
оформлення
[перевірена версія][перевірена версія]
Немає опису редагування
(оформлення)
Політика винятку заднім числом Wayback Machine частково ґрунтується на ''рекомендаціях з управління запитами на вилучення і збереження архівної цілісності'' ({{lang-en|Recommendations for Managing Removal Requests and Preserving Archival Integrity}}), опублікованих Школою інформаційного управління і системам в [[Університет Каліфорнії (Берклі)|Університеті Каліфорнії]] (Берклі) у 2002 році, який дає право власнику сайту заблокувати доступ до архіву сайту.<ref>{{Cite web|title=Recommendations for Managing Removal Requests And Preserving Archival Integrity|date=December 14, 2002|publisher=[[University of California]]|url=http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|accessdate=September 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170918025220/http://www2.sims.berkeley.edu/research/conferences/aps/removal-policy.html|archivedate=September 18, 2017}}</ref> Wayback дотримується цієї політики, щоб за можливості уникнути дорогих судових розглядів.<ref>{{Cite web|title=Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy|date=July 7, 2014|publisher=Internet Archive|url=https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|accessdate=September 14, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171010124036/https://archive.org/post/1019415/retroactive-robotstxt-removal-of-past-crawls-aka-oakland-archive-policy|archivedate=October 10, 2017}}</ref>
 
Політика винятку заднім числом Wayback почалипочала послаблюватися 2017 року, коли він перестав зважати на файли robots.txt на американських урядових і військових веб-сайтах як для їх сканування, так і показу відсканованих веб-сторінок. Станом на квітень 2017 Wayback ігнорує robots.txt в ширших межах, не тільки для урядових сайтів США.<ref>{{Cite web|url=http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|title=Robots.txt meant for search engines don't work well for web archives|website=Internet Archive Blogs|last=Mark Graham|date=April 17, 2017|accessdate=April 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170417131508/http://blog.archive.org/2017/04/17/robots-txt-meant-for-search-engines-dont-work-well-for-web-archives/|archivedate=April 17, 2017}}</ref><ref>{{Cite web|title=Archivierung des Internets: Internet Archive ignoriert künftig robots.txt|url=https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|publisher=heise online|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20170427035659/https://www.heise.de/newsticker/meldung/Archivierung-des-Internets-Internet-Archive-ignoriert-kuenftig-robots-txt-3693558.html|archivedate=April 27, 2017}}</ref><ref>{{Cite web|title=Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de|url=https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|accessdate=May 14, 2017|language=de-DE|deadurl=no|archiveurl=https://web.archive.org/web/20170619210648/https://www.golem.de/news/suchmaschinen-internet-archive-will-kuenftig-robots-txt-eintraege-ignorieren-1704-127446.html|archivedate=June 19, 2017}}</ref><ref>{{Cite web|title=Internet Archive will ignore robots.txt files to keep historical record accurate|url=https://www.digitaltrends.com/computing/internet-archive-robots-txt/|publisher=Digital Trends|accessdate=May 14, 2017|date=April 24, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20170516130029/https://www.digitaltrends.com/computing/internet-archive-robots-txt/|archivedate=May 16, 2017}}</ref>
 
== Використання ==
 
=== Обмеження ===
Незважаючи наПопри свої можливості, машина Wayback Machine також має деякі обмеження. У 2014 році булозатримка шість-місяцьміж часускануванням затримкивмісту міжсайтів і тимчасом, коли сайтвін обходібув ідоступним колина вонаWayback будеMachine, доступнастановила дляшість перегляду Машина Waybackмісяців.<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|last=|first=|date=April 2, 2014|website=Internet Archive|archiveurl=https://web.archive.org/web/20140402223358/https://archive.org/about/faqs.php|archivedate=2014-04-02|deadurl=yes|accessdate=November 23, 2018}}</ref> ВСтаном данийна час,листопад 2018 року час затримки становитьстановив від 3 до 10 годин.<ref>{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=November 23, 2018}}</ref> Машина Wayback-це Machine не є "історичніісторичним ГуглGoogle"; користувачі повиннімають знати URL-адреси веб-сайтів, які вони хочуть бачитипереглянути.<ref name=":4">{{Cite journal}}</ref> УВона ньогомає єфункцію функція"Site Search" (пошук на сайті"сайту), яка дозволяє користувачам знайти сайт на основі словаслів, що характеризуютьописують сайт, а не словаслів, знайденізнайдених на самих веб-сторінках.
 
Машина Wayback Machine не включаєне вмістить себеусіх всі веб-сторінкисторінок, коли-небудь зробленихстворених, через обмеженістьобмеження свого веб-краулеркраулера. Машина Wayback Machine не може повністю архівархівувати веб-сторіноксторінки, які містять інтерактивні функції, такі як Флеш-платформи і формформи, написанихнаписані на JavaScript, бо тіці функції, що вимагають взаємодії з хост-сайтсайтом. Їх вебВеб-гусеничний,краулер насилумає витягаючитружнощі нічогоз невитягуванням усього, що закодовано уне в HTML (або одинодному з його варіантів), якийщо часто призводить до зламаноїзламаних гіперпосиланнягіперпосилань та відсутніх зображень. Крім того, веб-краулер не архівіархівує "сирота сторінок-сиріт", які не містять посилань на інші сторінки.<ref name=":2">{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=October 18, 2018|archiveurl=https://web.archive.org/web/20130420213122/http://archive.org/about/faqs.php|archivedate=April 20, 2013|deadurl=no}}</ref><ref name=":4">{{Cite journal}}</ref> КонкретнихКонкретні нормправила, що регулюють шляхукраулер машиниWayback обхідникMachine, можеможуть слідуватидослідити тількилише заздалегідьнаперед заданувизначену кількість гіперпосилань, ґрунтуючись на основінаперед заданоїзаданому глибиніобмеженні межіглибини, тому він не може архівувати всі гіперпосилання на кожній сторінці.<ref name=":3">{{Cite web|url=https://archive.org/details/widecrawl&tab=about|title=Worldwide Web Crawls|publisher=Internet Archive|last=|date=|accessdate=October 16, 2017|deadurl=no|archiveurl=https://web.archive.org/web/20171019222740/https://archive.org/details/widecrawl%26tab%3Dabout|archivedate=October 19, 2017}}</ref>
 
Деякі власники поміститипоміщають на свій сайт файл robot.txt на сайті, який заважаєне машинадозволяє Wayback відMachine відкриттязнаходити та архівуванняархівувати їх. Крім того, власники веб-сайтів також можуть безпосередньо зв'язатися з інтернетІнтернет-архіву безпосередньоархівом і просити, щоб їх сторінки будутьбуло виключенівилучено з архіву.<ref name=":2">{{Cite web|url=https://archive.org/about/faqs.php|title=Internet Archive Frequently Asked Questions|website=archive.org|language=en|accessdate=October 18, 2018|archiveurl=https://web.archive.org/web/20130420213122/http://archive.org/about/faqs.php|archivedate=April 20, 2013|deadurl=no}}</ref>
 
=== ВЯк юридичні докази ===
 
==== ЦивільногоЦивільне судочинствасудочинство ====
 
===== ''Netbula ТОВLLC Ст.проти Chordiant Software Інк''Inc. =====
У справі 2009 випадку,року ''Netbula, ТОВLLC Ст.проти Chordiant Software ІнкInc'', відповідач Chordiant подав клопотання, щоб відключити Netbula на своєму сайті вимкнула файл [[robots.txt]] файл на своєму сайті, щоякий викликаєзмушував спортіWayback Machine заднім числом видалитизакривати доступ до попередніх версій сторінок, булозаархівованих перевірено Netbulaз сайту, сторінкиNetbula, які, на думку Chordiant повіривмогли биб підтримати її справоюсправу.<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=October 15, 2009}}</ref>
 
Netbula заперечила проти рухуцього клопотання на тій підставі, що відповідачівідповідач зверталися з проханням переробитизмінити сайт Netbula і що вонивін повиннімав булиби викликанібезпосередньо взвернутися архівідо інтернетуАрхіву дляІнтернету сторінкиза безпосередньосторінками.<ref name="antonio_cortes">{{Cite web|last=Cortes|first=Antonio|date=October 2009|title=Motion Opposing Removal of Robots.txt|url=http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE/|accessdate=October 15, 2009|deadurl=no|archiveurl=https://web.archive.org/web/20101027050350/http://www.american-justice.org/index.cgi/Page/116/OPPOSITION-TO-MOTION-TO-COMPEL-REMOVAL-OF-ROBOT-TXT-FILE-FROM-WEBSITE|archivedate=October 27, 2010}}</ref> СпівробітникПроте, співробітник інтернетІнтернет-архівіархіву подалаподав заяву під присягою, підтримкиякою рухупідтримав дію Chordiant, однак, заявивши, що він не може вироблятивидати веб-сторінки за допомогою інших засобів "без значного навантаження, витратавитрат і перебоїперебоїв ву його діяльностіроботі."<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=October 15, 2009}}</ref>
 
Суддя суддя Говард Ллойд ву Північному окрузі КаліфорніяКаліфорнії, відділвідділі Сан-Хосе, відхилив доводи Netbula і наказав їм тимчасово відключитивимкнути блокування robots.txt для того, щоб Chordiant дляотримали отриманняархівні архівних сторіноксторінки, які вониїм були шукалипотрібні.<ref name="howard_lloyd">{{Cite web|last=Lloyd|first=Howard|date=October 2009|title=Order to Disable Robots.txt|url=http://www.american-justice.org/upload/page/123/69/docket-187-order-on-IA-motion.pdf|format=PDF|accessdate=October 15, 2009}}</ref>
 
===== Компанії Telewizja Polska =====
У жовтні 2004 року випадок,у справі ''[[TVP|ТВTelewizja ПольскаPolska СШАUSA, Inc.]] Ст.проти ЭкоСтарEchostar СупутниковимиSatellite''Р., No. 02 ЗC 3293, 65 ФРСFed. РR. ЭвидEvid. СервServ. 673 (НN. ДD. ХворийIll. October 15 жовтня, 2004 року), позивач намагався використовувати видавцявикористати архівівWayback машинаMachine як джерело допустимих доказів, мабуть, вперше. Компанії Telewizja Polska є постачальникомпровайдером [[{{нп|TVP Polonia|ТВП|en|TVP полонію]]Polonia}} і [[{{iw|EchoStar Communications Corporation|Экостар]]|}}, працюєяка вуправляє [[Dish Network|Мережі тарілки]]. До початку судового розгляду, ЭкостарEchoStar вказала, що вона має намір запропонувати спорті знімки Wayback Machine як доказ минуломуминулого змісту сайту компанії Telewizja ПольскаPolska. Компанії Telewizja Polska і приніс рухподала ''[[In{{нп|Клопотання in limine|в|en|Motion in limine]]}}'', щоб придушитине знімкидати хід знімкам на тій підставі, [[Hearsayщо нібито це {{нп|чуток]]Чутки (право)|чутки|en|Hearsay}} і неперевіренихнеперевірене джерелджерело, але суддя ArlanderАрландер, ключіввідхилив відхиленітвердження ТБTelewizja польськоїPolska, затвердженнящо чутокнібито іце відмовленочутки вй ПВвідмовив рухуу клопотанні ''вin limine'', щоб виключити докази в суді.<ref name="gelman">{{Cite journal}}</ref><ref name="howell">{{Cite journal}}</ref> На суді, однак окружний суддя Рональд Гузман суд, суддя, скасував висновків світового судді ключів, [потрібна цитация] і постановив, що ні присягою інтернет-співробітник архіву, ні базових сторінок (тобто ТБ Польска сайт приймаються в якості доказів. Суддя Гусман розсудив, що заява працівника містило чуток і непереконливі підтвердження, і передбачуваний веб-сторінки, роздруківки не вимагають засвідчення. [правити]
 
==== Патентне право ====