Вікіпедія:Кнайпа (технічні питання): відмінності між версіями

Вилучено вміст Додано вміст
Albedo (обговорення | внесок)
Neon (обговорення | внесок)
Рядок 350:
::::А наші боти, які займалися заливаками (U-Bot і ElimBot), із цим не справляться?--{{Користувач:Ahonc/Підпис}} 10:20, 2 вересня 2007 (UTC)
:::::Ну, географічну інформацію я міг би частково надати. А от на бій, чи, пак роботу із ботом поки нема часу розбиратись.--[[Користувач:Albedo|<font color=white face="Sans serif">A®</font></sup></b>]] 16:27, 2 вересня 2007 (UTC)
:::::: Извините за неправильный язык, я расскажу как мой бот работает. Он берёт за основу хорошо развитую википедию (мы брали немецкую для немецких австрийских и швейцарских городов, польскую для польских городов, повятов и гмин, индонезийская для индонезийских провинций и городов) - например немецкую. В этой википедии должны активно использоваться шаблоны - потому что весь смысл в том чтобы парсить. Потом составляется большой словарь - это список немецких статей, они транслитерируются на русский (автоматически!), так как транслитерация не всегда грамотна, все списки надо вручную проверять. То есть для Германии 10000 названий были проверены вручную. Это были списки типа [[:ru:Города Баварии]] на двух языках. Далее начинается парсинг статей - о землях, районах, коммунах, городах. Главное в этом - чтобы был хорогий габлон, он заменяется на русский текст и русский шгаблон. И ещё перекачиваются все картинки. В общем работа программирования тоже есть - сотставить транслитератор, составить парсинг щаблона, составить перезаливщик статей ... Это того стоит когда перекаяиваются тысячи статей - мне удалось скачать около 25000... [[Користувач:Neon|неон]] 18:51, 2 вересня 2007 (UTC)