Обговорення Вікіпедії:Проєкт:Енциклопедія історії України/А

@Sergento: @Rar: @Thevolodymyr: @Tohaomg: Добрий день. Питання є до Вас. Хочу трохи просунути вперед проблему з цією енциклопедією, яка розміщена під вільною ліцензією. Треба якось визначити, які зі статей, вже розміщених в українській Вікіпедії, повністю чи частково взяті з неї. Я вже якусь кількість таких статей позначив, заодно їх відпатрулювавши. Їх попереносив один користувач. А решту статей переносили багато інших користувачів, тому я не можу за чиїмось внеском їх далі прослідкувати. Багато статей написані на основі зовсім інших джерел, або ж значно розширені чи переписані. І вручну порівнювати кожну статтю займає дуже багато часу. Якби зробити якогось бота, щоб він, скажімо взяв всю сукупність статей під літерою "А" і порівняв кожну з них на предмет збігів з сукупністю статей [на літеру А на сайті Енциклопедії], або ж оцим простором назв (якщо з ним, то можна зразу порівнювати всі літери від А до П. І так порівняти для інших літер. Після П можна порівнювати тільки з тими, що на сайті. Для чого це потрібно зробити? Так би я зразу відпатрлював і позначив статті, які взяті з енциклопедії, щоб далі вже їх спокійно доповнювали на основі інших джерел (це може бути кілька тисяч статей). А ті статті, які не матимуть збігів, можна буде, наприклад, перевірити на предмет порушення авторських прав і замінити інформацію в них, на ту, що в енциклопедії, якщо права порушені. Якщо то мікростаби, то можна буде їх подоповнювати, щось поуточнювати тощо.--Oleksandr Tahayev (обговорення) 16:31, 24 вересня 2018 (UTC)Відповісти

Якщо мова йде про порівняння текстів статей, то я не візьмуся таке робити. Якщо пошукати назви статей у вікі, які є в ЕІУ — це простіше. Можна подивитися також у бік списку статей, які посилаються на Енциклопедія історії України/у яких є шаблон {{ЕІУ}} (бо я дивлюся, що у джерелі, якщо використовувалась ЕІУ, зазвичай посилаються на її сторінку). І можна, наприклад, отримати тоді список статтей, які є і в тому списку, і в другому. Не знаю, наскільки це могло би допомогти. --Sergento 09:11, 25 вересня 2018 (UTC)Відповісти
@Sergento: Це погано. Такий бот мені насправді дуже спростив би роботу. За назвами статей дуже довго виходить, тому що це треба перечитувати всі підряд статті, серед яких, наприклад, про цілі області, значні історичні події, по 100 кілобайтів. Посилання з цим шаблоном проставляли і на купу статей, які не використовують тексту ЕІУ. 10 великих томів - це величезний обсяг, мені самому, щоб кожну з них окремо перевірити пішло б кілька років. Забути про решту вікіпедійної діяльності і залишки сподівань на особисте життя. Я хотів лише повідзначати статті, які точно збігаються, а решту залишити для людей, які займаються конкретними темами.--Oleksandr Tahayev (обговорення) 09:30, 25 вересня 2018 (UTC)Відповісти
@Sergento: Я просто думав, що можна було би зробити якийсь інструмент на основі цього. Тут я взяв статті Супряга з Вікіпедії й порівняв її з відповідною статтею на сайті ЕІУ. Якби можна було, щоб бот якось використовував цей інструмент, але брав одразу всі статті на літеру С у цьому проекті і порівнював їх одразу з усіма статтями на літеру С на сайті ЕІУ--Oleksandr Tahayev (обговорення) 10:56, 25 вересня 2018 (UTC)Відповісти
Інструмент цікавий і в принципі може полегшити справу. Треба подосліджувати, як його можна використати ботом і що із цього може вийти. Коли матиму трохи більше часу, подивлюся. Якщо до того часу не буде іншого рішення. --Sergento 11:29, 25 вересня 2018 (UTC)Відповісти
@Sergento: @Oleksandr Tahayev: Я трохи відлучався від мережі, щойно побачив. Спробую задуматися над цим питанням у п'ятницю, бо так відразу ідей не маю. --Rar (обговорення) 17:53, 26 вересня 2018 (UTC)Відповісти
@Sergento: @Oleksandr Tahayev: Нічого корисного до голови не прийшло. Алгоритми пошуку плагіату складні, а тут справа додатково ускладнюється масовим використанням в ЕІУ скорочень (чого варте ЄВПАТОРІЯ... У 3-й чв. 6 ст. до н. е. тут виникла давньогрец. колонія Керкінітида (Керкенітида). Від 30-х рр. 4 ст. до н. е. місто входило до складу Херсонеської д-ви) та змінами які на текст накладає вікірозмітка. Теоретично, можна зробити програму яка вишуковуватиме спільні назви та автоматично відкриватиме у закладках браузера результат порівняння того інструменту (Earwig's Copyvio Detector) і саму вікі-статтю або/і вікно її редагування. Але 1) виконання програми буде можливе тільки на комп'ютері з встановленим Python-ом, 2) важко дати гарантію, що це працюватиме безаварійно.--Rar (обговорення) 20:29, 28 вересня 2018 (UTC)Відповісти
Повернутися на сторінку проєкту «Проєкт:Енциклопедія історії України/А».