OCRopus
OCRopus — OCR-система на базі відкритого розпізнавального ядра — tesseract. Програмний пакет для розпізнавання тексту, що розвивається за принципами Open Source і розповсюджується під Apache License 2.0. За задумом розробників, з допомогою OCRopus стане можливим визначати текстовий вміст на цифрових зображеннях і переводити його в звичайний текстовий формат для подальшого редагування. Крім друкованого тексту, програма зможе розпізнавати і рукописні матеріали. За станом на альфа-реліз, OCRopus використовує код мови моделювання з іншого проекту, що підтримується Google — OpenFST. OCRopus в наш час[коли?] доступний лише для Linux.
Тип | розпізнавання тексту |
---|---|
Розробник | Thomas Breuel DFKI |
Стабільний випуск | 0.4.4[1] (березень 2010 р.) |
Операційна система | FreeBSD, Linux, macOS і Windows 10 |
Мова програмування | C++ і Python |
Українська мова | ні[2] |
Ліцензія | Apache License вер. 2.0 |
Репозиторій | https://github.com/tmbdev/ocropy, https://github.com/ocropus/ocropy.git |
Вебсайт | www.ocropus.org |
Використання
ред.В даний час OCRopus може бути використаний тільки з командного рядка. Після встановлення можна посилатися, вказуючи вхідне зображення з текстом. Він виведе hOCR HTML-код. Якщо необхідний точніший контроль, можна вказати в командному рядку команду для виконання конкретних операцій (наприклад, розпізнавання одного рядка).
Історія розвитку
ред.Див. також
ред.Примітки
ред.- ↑ OCRopus release notes. Архів оригіналу за 12 лютого 2010. Процитовано 24 грудня 2009.
- ↑ ocropus | Групи Google. Архів оригіналу за 9 лютого 2010. Процитовано 24 грудня 2009.
- ↑ Old OCRopus Wiki - Сторінку не знайдено. Архів оригіналу за 4 липня 2008. Процитовано 4 липня 2008.
- ↑ Old OCRopus Wiki - Upcoming Releases
Посилання
ред.- Офіційний сайт
- IUPR Publication Server [Архівовано 27 квітня 2009 у Wayback Machine.] (опис алгоритмів, використовуваних у OCRopus)
- Офіційний сайт OpenFST [Архівовано 27 лютого 2009 у Wayback Machine.]