WebCite — інтернет-сервіс, що виконує архівування вебсторінок за запитом. Згодом на заархівовану[en] сторінку можна послатися через URL. Користувачі мають можливість отримати архівну сторінку в будь-який момент і без обмежень, до того ж не важливий статус й стан оригінальної вебсторінки, з якої була зроблена архівна копія. Таке архівування особливо важливо в академічному контексті. WebCite є некомерційним консорціумом, який підтримується видавцями та редакторами, і може використовуватися будь-якими бажаючими безкоштовно.

WebCite
Логотип
Webcitation.org-Screenshot.png
Посилання www.webcitation.org
Гасло (девіз) Зберігаючи для нащадків
Комерційний ні
Тип архів, вебсайт
Мови англійська
Власник Торонтський університет
Автор Гюнтер Айзенбах
Започатковано 1998
Стан онлайн
Рейтинг Alexa 98,187 (August 2015)[1]
CMNS: WebCite у Вікісховищі

На відміну від проєкту «Архів Інтернету», WebCite не використовує роботів для автоматичної архівації всіх підряд вебсторінок. WebCite архівує сторінки тільки у відповідь на прямий запит користувача. WebCite архівує весь контент на сторінці — HTML, PDF, таблиці стилів, JavaScript і зображення. WebCite також архівує метадані про архівуємі ресурси, такі як час доступу, MIME тип та довжину контенту. Ці метадані корисні для встановлення автентичності та походження архівованих даних.

WebCite є членом «англ. International Internet Preservation Consortium»[2]..

ІсторіяРедагувати

Задуманий в 1997 році Гюнтером Айзенбахом (англ. Gunther Eysenbach), WebCite був публічно описаний в наступному році, коли в статтях про контроль якості Інтернету з'явилися заяви, що подібний сервіс може вимірювати інтенсивність цитування вебсторінок[3]. У тому ж році був здійснений пілотний запуск сервісу за адресою webcite.net (див. архівні скріншоти «WebCite» через «Wayback Machine» архівовані 3 лютого 1999 р.). Незабаром після цього на ринок вийшли «Google» й «Архів Інтернету», що зменшило потребу в сервісі типу WebCite.

Ідея WebCite була відроджена в 2003 р., коли в дослідженні, опублікованому в журналі «Science», були зроблені висновки, що до сих пір не існує адекватного та відповідного рішення для архівації вебсторінок[4]. «Архів Інтернету» і «Google» не надають архівацію «за запитом» користувача, й вони не мають необхідного інтерфейсу для наукових журналів і видавництв, який би дозволяв автоматизувати архівацію цитованих посилань. На 2008 рік понад 200 журналів почали повсякденно використовувати WebCite[5].

Лоуренс Лессіг, американський академік, який досліджує теми авторського права та технологій, використовував WebCite в своєму «amicus brief» в судовому процесі англ. MGM Studios, Inc. v. Grokster, Ltd., який розглядався у Верховному суді США[6].

ВідключенняРедагувати

Відключення в червні-липні 2009 року

У червні 2009 р. процес додавання до архіву WebCite нових сторінок був призупинений. 19 червня створювач WebCite написав, що збільшене навантаження на сервера є наслідком роботи бота «WebCiteBOT», який працював в Англійській Вікіпедії. Тому WebCite був переведений на новий сервер, й під час «перекладу» сервіс був недоступний[7]. Станом на кінець червня 2009 року WebCite став повністю недоступний, посилання на раніше заархівовані сторінки не працювали. Повне відновлення функціональності сталося на другому тижні липня 2009 року.

Відключення в 2013 році

У серпні 2013 р сайт кілька днів не працював. У 2013 р. проєкт переживав труднощі з фінансуванням й оголосив збірку коштів[8]. Якщо б не вдалося зібрати необхідну суму (22,5 тис. доларів[8]), WebCite припинив архівацію з грудня 2013 року.

Відключення в 2014 році

В кінці січня та першій половині лютого 2014 р. сайт не працював. У грудні були доступні старі посилання, проте кешування нових було неможливе через нестачу вільного місця. В кінці року проблему вдалося вирішити й сервіс працював в штатному режимі знову.

Порядок архіваціїРедагувати

WebCite дозволяє робити архівацію за запитом (англ. On-demand). Він не використовує вебкраулерів, сторінки архівуються тільки на прямий запит користувача.

Щоб ініціювати кешування й архівування сторінки, автор може використовувати спеціальне меню на сайті або створити спеціальний букмарклет, завдяки якому можливо переходити на заархівовану сторінку за допомогою простого «кліка» на відповідній закладці.

Заархівована на сервері WebCite сторінка доступна через дві різні вебадреси (URL): довгий і укорочений. Довга вебадреса містить в собі URL оригінальної (архівованої) сторінки та дату архівації. Використовується така схема:

http://webcitation.org/query?url=URL&date=DATE

, де URL є URL-адресою оригінальної сторінки, яка піддалася архівуванню, а DATE є датою архівації.
Наприклад:

http://webcitation.org/query?url=http%3A%2F%2Fen.wikipedia.org%2Fwiki%2FMain_Page&date=2008-03-04

Інша, скорочена форма не містить оригінальної URL-адреси й дати, але значно коротше, ніж довга форма. Наприклад, скорочена форма вищенаведеної сторінки буде наступною:

http://webcitation.org/5W56XTY5h [Архівовано 16 лютого 2012 у Wayback Machine.]

І довга, і коротка форма, яка наведена як приклад, посилається на ту ж саму сторінку: https://en.wikipedia.org/wiki/Main_Page [Архівовано 2 грудня 2003 у Wayback Machine.], що була архівована 4 березня 2008 року.

Форма архівації на сторінці http://www.webcitation.org/archive [Архівовано 8 червня 2016 у Wayback Machine.] (на головній сторінці WebSite за адресою http://www.webcitation.org [Архівовано 24 лютого 2013 у Archive.is] натиснувши на «ARCHIVE» у верхній частині екрану). Для заповнення обов'язкові є лише перші два поля цієї форми.

  • Перше поле: «URL to Archive [url]». У нього вводять повний URL (вебадресу) сторінки, яку потрібно заархівувати.
  • Друге поле: «Your (citing author) E-mail Address [email]». У нього вводять адресу електронної пошти, на яку WebCite може надіслати повідомлення про результат архівації. Якщо архівація успішна, тоді в листі надходить посилання на заархівовану копію оригінальної сторінки. WebCite використовує поштові адреси користувачів тільки для надсилання звітів про результати архівації, не використовує їх в інших цілей (напр. реклама і спам).

Всі наступні поля не обов'язкові для заповнення, проте їх рекомендують заповнити. Інформація з них використовується як метадані та зберігається в архіві WebCite разом з архівною копією. Якщо для якогось поля немає інформації, наприклад невідомий автор або дата публікації (див. опис полів нижче), то відповідні поля залишаються незаповненими.

  • В поле «Title» вводять назву матеріалу, який розміщений на архівуємій сторінці.
  • В поле «Author (s)» вводять ім'я автора (імена авторів) цього матеріалу в форматі «Прізвище, Ім'я»; якщо авторів декілька, розділяють їх імена крапкою з комою.
  • В поле «Cited Author's E-mail» вводять електронну адресу автора (електронні адреси авторів) матеріалу.
  • В поле «Publisher» вводять назву сайту або організації, на сайті якої розміщена архівована вебсторінка.
  • В поле «Date» вводять дату публікації матеріалу, якщо вона відома, з максимальною точністю аж до дня в форматі рррр-мм-дд (наприклад, 1998-10-06). Якщо день невідомий, а відомий тільки місяць і рік, використовують формат рррр-мм (наприклад, 1998-10), а якщо відомий тільки рік, використовують рррр (наприклад, 1998). Якщо дата взагалі невідома, залишають поле порожнім.
  • В поле «Subject Keywords» вводять одне або кілька ключових слів для матеріалу, який розміщений на архівованій сторінці.

Коли поля заповнені, натискають кнопку «Submit». Через якийсь час користувачеві буде показана інша сторінка, на якій буде інформація про результат архівування.

ВикористанняРедагувати

До прикладу в шаблоні {{cite web}} є два параметри, спеціально призначені для архівних посилань: archiveurl і archivedate. У першому параметрі вказують власне посилання на архівну копію, в довгій або укороченій формі. У другому параметрі вказують дату архівації, тобто того дня, коли було зроблено вебархівування.

Модель бізнесуРедагувати

Слово WebCite є зареєстрованою торговою маркою[9].

WebCite не бере гроші з будь-яких користувачів сервісу[10]. WebCite отримує дохід від пожертвувань видавців, які хочуть, щоб «їх публікації були проаналізовані та цитованими через вебархів»[11]. На початку своєї роботи WebCite отримував гроші від Торонтського університету[12].

Восени 2013 р. велися переговори про можливість створення комерційного сервісу на базі WebCite[13].

Авторські праваРедагувати

WebCite підтримує правову позицію, згідно якої його архівна діяльність допускається доктринами сумлінного використання та наявної ліцензії. Для підтримки аргументу про сумлінне використання WebCite вказує, що його архівні копії вебсторінок є трансформативними творами (англ. Transformativeness), вони є суспільно-корисними для наукових досліджень і не завдають шкоди ринковій вартості будь-якій праці, що охороняється авторським правом. WebCite підкреслює, що кешування та архівування вебсторінок не може визначатись як порушення авторського права, тому що власник оригінальної сторінки має право вимагати прибрати її з архіву[2].

19 січня 2009р. відбувся судовий процес «англ. Field vs Google» (CV-S-04-0413-RCJ-LRL), що стосувався процесу кешування вебсторінок компанією «Google». У результаті Окружний суд Невади в США (англ. United States District Court for the District of Nevada) в судовому рішенні постановив, що кешування вебсторінок не є порушенням авторського права[2].

За вимогами правовласників WebCite видаляє сторінки з публічного доступу, поміщаючи їх в «темний архів» (англ. Dark archive) доступ до якого можна отримати на платній основі ($200 за 5 сторінок плюс $100 за кожні наступні 10 сторінок)[14].

Див. такожРедагувати

ПриміткиРедагувати

  1. Webcitation.org Site Info. Alexa Internet. Архів оригіналу за 26 грудня 2018. Процитовано 15 серпня 2015.  (англ.)
  2. а б в WebCite® Consortium FAQ. www.webcitation.org. WebCite. Архів оригіналу за 11 серпня 2021. Процитовано 8 червня 2016.  (англ.)
  3. Eysenbach, Gunther; Diepgen, Thomas L. (28 листопада 1998). Towards quality management of medical information on the internet: evaluation, labelling, and filtering of information. British Medical Journal (London: BMJ Publishing Group Ltd) 317 (7171): 1496–1502. ISSN 0959-8146. OCLC 206118688. PMC 1114339. PMID 9831581. BL Shelfmark 2330.000000. Архів оригіналу за 13 липня 2010. Процитовано 27 лютого 2008. (англ.)
  4. Dellavalle, Robert P; Hester, Eric J; Heilig, Lauren F; Drake, Amanda L; Kuntzman, Jeff W; Graber, Marla; Schilling, Lisa M (31 жовтня 2003). Going, Going, Gone: Lost Internet References. Science (Washington, D.C.: American Association for the Advancement of Science) 302 (5646): 787–788. ISSN 0036-8075. OCLC 211169635. PMID 14593153. doi:10.1126/science.1088234. BL Shelfmark 8130.000000. Архів оригіналу за 1 травня 2009. Процитовано 27 лютого 2008.  (англ.)
  5. Eysenbach, Gunther; Trudel, Mathieu (2005). Going, Going, Still There: Using the WebCite Service to Permanently Archive Cited Web Pages. Journal of Medical Internet Research (Toronto: Centre for Global eHealth Innovation at the University Health Network) 7 (5): e60. ISSN 1438-8871. OCLC 107198227. PMC 1550686. PMID 16403724. doi:10.2196/jmir.7.5.e60. Архів оригіналу за 20 червня 2016. Процитовано 27 лютого 2008.  (англ.)
  6. Cohen, Norm (29 січня 2007). Courts Turn to Wikipedia, but Selectively. New York Times. Архів оригіналу за 30 квітня 2011. Процитовано 8 червня 2016.  (англ.)
  7. Gunther Eysenbach — Twitter update [Архівовано 6 березня 2016 у Wayback Machine.] (англ.)
  8. а б Gunther Eysenbach. Fund WebCite (http://www.webcitation.org). FundRazr. Архів оригіналу за 16 лютого 2013. Процитовано 4 серпня 2013.  (англ.)
  9. WebCite Legal and Copyright Information. WebCite Consortium. Архів оригіналу за 17 червня 2016. Процитовано 16 червня 2009.  (англ.)
  10. WebCite Member List. WebCite Consortium. Архів оригіналу за 31 травня 2016. Процитовано 16 червня 2009. «Membership is currently free»  (англ.)
  11. WebCite Frequently Asked Questions. WebCite Consortium. Архів оригіналу за 11 серпня 2021. Процитовано 16 червня 2009.  (англ.)
  12. WebCite Frequently Asked Questions – Who owns and runs WebCite at the moment?. WebCite Consortium. Архів оригіналу за 11 серпня 2021. Процитовано 16 червня 2009. «WebCite has been incubated and is still hosted at the University of Toronto / University Health Network's Centre for Global eHealth Innovation.»  (англ.)
  13. Conversation between GiveWell and Webcite on 4/10/13. GiveWell. Архів оригіналу за 24 жовтня 2020. Процитовано 18 жовтня 2009. «Dr. Eysenbach is trying to decide whether Webcite should continue as a non-profit project or a business with revenue streams built into the system.»  (англ.)
  14. WebCite takedown requests policy [Архівовано 14 березня 2016 у Wayback Machine.] (англ.)

ДжерелаРедагувати

ПосиланняРедагувати