Обговорення користувача:Дядько Ігор/Боти (12.05.2009—12.05.2009)

Повний архів: Обговорення_користувача:Дядько_Ігор/АвтоАрхів
Обговорення: Обговорення_користувача:Дядько_Ігор

Боти ред.

Вітаю :) виявилось у Вас цілих два боти, які вміють заливати статті :) хочу уточнити, Ви дороблятимете ці статті? бо навіть серед інтервік залишається тільки англійська.. --Erud 06:38, 12 травня 2009 (UTC)Відповісти

Це лише тест. Я вчуся працювати з ботами. Сторінки дороблю, звісно. А бота справжнього в мене ще нема - подав заявку на дозвіл. Дядько Ігор 06:43, 12 травня 2009 (UTC)Відповісти
А чи не могли б Ви мены хоча б коротенько пояснити, як взагалі керується бот? Звідки Ви запускаєте скрипт? --Erud 07:14, 12 травня 2009 (UTC)Відповісти
Доволі просто. Треба спочатку скачати pywikipedia. Це описано на сторінці Довідка:Роботи. Потім створити собі файл user-config.py, знову ж усе описано. Далі у директорії pywikipedia у вас є багато готових скриптів. Я їх поволі пробую. Ще не знаю, що кожен може. get.py дозволяє отримати сторінку. pagefromfile.py - створити сторінку із заготовки. Заготовку можна зробити іншою програмою - для мене це не проблема. Ну і login.py - залогінитися. Запуск:
>python login.py
>python get.py Афіни (наприклад)
>python pagefromfile.py -start:<мітка початку статті> -end:<мітка кінця статті> -file:<назва файлу заготовки> -safe
Остання команда трошки складненька, але в файлі pagefromfile.py все доволі зрозуміло описано. Ну а решту - звичайні можливості Linux. --Дядько Ігор 07:24, 12 травня 2009 (UTC)Відповісти
О, дуже дякую   є над чим помислити! --Erud 07:42, 12 травня 2009 (UTC)Відповісти
Скачати pywikipedia найпростіше, запустивши з терміналу
>svn checkout http://perlwikipedia.googlecode.com/svn/trunk/
--Дядько Ігор 07:56, 12 травня 2009 (UTC)Відповісти
Якщо це бот на основі pywikipedia, то може якось ділитимось досвідом? Мені створення модуля котрий перекладає картки, витягує інформацію з тексту зайняло багато часу, але працює. Транслітерація назв у Вас автоматична? Запрошую на ВП:П:АО, може знайдуться ще охочі допомогти --Rar 07:16, 12 травня 2009 (UTC)Відповісти
Список перекладів назв я підготував сам, тобто транслітерацію не використовував. це важко. Картку я не робив у даному випадку, але приклад перекладу картки, який я написав є на сторінці Perl, тобто це не принципова проблема. Файл-заготовку згенерував Perl'ом. Потім завантажив. Десь біля 8 секунд на сторінку. Потім перевірка. Загалом повинно виходити швидше, особливо якщо створювати статті, беручи інформацію з якоїсь бази даних. Тобто, інструмент є. Наскільки я його використовуватиму - невідомо. Дядько Ігор 07:37, 12 травня 2009 (UTC)Відповісти
Щодо участі в проекті ВП:П:АО. Колись я написав скрипт для перекладу карток. Створив кілька міст Австрії. Можна глянути в [[Категорія:Міста Австрії]] - там половина автоматично створених. Але потім був написаний скрипт для сіл України, яким я створив десь біля 2000 статей, а Томахів - біля 28 тисяч. Я не знаю, скільки в нього був рекорд, але десь під 500 сторінок в день. Після цього ми заспокоїлися, щоб зовсім не завалювати нашу вікіпедію стабами і не перетворитися у волапюкську вікіпедію. Загальна думка була - робити краще. Ваші італійські статі вже дещо кращі. --Дядько Ігор 08:10, 12 травня 2009 (UTC)Відповісти
Мене ще тоді тут не було :). Щодо стабів - деякі статті залишаться стабами назавжди - не про кожне село чи муніципалітет є що написати. Але статті потрібні - села України це добрий кусок роботи. Щодо техніки - я роблю трішки інакше - завантажую через Special:Export відразу багато сторінок (без бота, записую у файл .xml), допоміжні сторінки також (нп. шаблони демографій), потім запускаю програму лише на "переклад тексту" - завжди кілька сторінок мають щось нестандартне (треба викинути чи підправити), а вже тоді пускаю з ботом. pagefromfile.py не використовую, вписую просто з програми яка формує текст (також на python). Транслітерація це справді важко, але якщо налаштовуватись на велику кількість сторінок, то оплачується. Звичайно треба переглядати "що воно там натранслітерувало", робити список винятків. Мені помагає Користувач:AnatolyPm, я італійської майже не знаю.
Ага, крім цього, відразу ботом створюю редиректи, сторінку обговорення, щоб не повертатися до проблеми. В графствах два редиректи очевидні навіть як немає двозначності транскрипції. --Rar 08:31, 12 травня 2009 (UTC)Відповісти
Повернутися на сторінку користувача «Дядько Ігор/Боти (12.05.2009—12.05.2009)».