Користувач:Микола123/пісочниця

Аналіз алгоритмів розпізнавання для різних класів


Розпізнавання образів актуальне для систем, які обробляють відео потік. Тобто, в режимі реального часу ми отримуємо потік байт,

переданий із відео системи, та застосовуємо певні алгоритми для визначення класу об’єкту. Ось, для прикладу одна із задач, де використовується аналіз відео: мобільний робот, під час руху, повинний розпізнавати образи, розташовані на столі за допомогою відеокамери. З малим числом образів задача повинна вирішуватися в реальному часі .

Сьогодні існують алгоритми, що дозволяють визначити до якого типу відноситься даний об’єкт. Але вони, як правило, були реалізовані для вузького кола застосування. Було проведено дослідження алгоритмів розпізнавання об’єктів. Серед них приведено ті, які мають найменше недоліків чи їхня швидкодія дозволяє працювати в системах реального часу.
II. АНАЛІЗ ШТРИХОВИХ ЕЛЕМЕНТІВ
Він полягає в пошуку вертикальних і горизонтальних відрізків, дуг різної орієнтації. Основне завдання полягає у вимірюванні довжин і в аналізі взаємного розташуванні цих дуг. На якість розпізнавання також впливають: обсяг набору розпізнаваних символів, технологія навчання нейронної мережі, методика й алгоритми виділення первинних ознак, технологія підготовки навчальної бази даних й інші фактори .

:Мета аналізу – визначити місця переходу між білою та чорною областю зображення, на їх основі визначити прямі лінії, а на перетині прямих ліній визначити кути отриманої рамки штрихованого тексту [3]. Дослідним шляхом визначається така кількість послідовних точок переходу, що може трактуватися як пряма лінія. Слід зазначити, що перебирати все зображення попіксельно недоцільно. Після знаходження першого перепаду кольору пряма лінія визначається різницею між кольорами сусідніх пікселів. Для цього використаємо функцію:

ƒ(i)=A * sin((2*P*(i+C)/B)), (1)

де А – амплітуда, відстань по осі ординат аналізованого пікселя від прогнозованої границі (підбирається експериментально); В – коефіцієнт розтягнення по осі абсцис; С – забезпечує початкові умови для сканування (з якого пікселя обчислюється перехід кольору). Коефіцієнти А, В, С доцільно обирати серед множини натуральних чисел. Таким чином кількість аналізованих пікселів можливо скоротити в два рази. Прикладом застосування даного методу є розпізнавання номерного знаку автомобіля.

III РОЗПІЗНАВАННЯ ОБЛИЧ
Для ефективного розпізнавання осіб необхідно розробити певний компактний та зручний формат подання картинок. На першому етапі алгоритм виділяє із загального зображення обличчя. потім відбувається нормалізація зображення [1]. До нормалізації зображення відносяться наступні дії:Зміна дозволу зображення до 100 * 100 пікселів; gеретворення кольорів до 256 відтінків сірого; ; зміна сумарної яскравості зображення до деякого середнього значення[5].

Такі алгоритми виражається певною функцією розпізнавання F(A), де A – множина параметрів, за якими здійснюється розпізнавання [6]. Один з найстаріших методів розпізнавання облич, парктичне застосування якого започаткували криміналісти – геометричний метод.

Після одержання картинки, формуються бінарні образи. При роботі з кольоровою камерою перетворення з кольору в чорно, білий колір йде по стандартній формулі
Y:=0.3*R+0.59*G+0.11*B (2)
Далі алгоритм досить простий: є деяка планка оцінки. Якщо колір відтінку сірого вище - він вважається білим, якщо нижче - вважається чорним. При обчисленні ряду морфометричних ознак, використовуються поняття механіки твердого тіла [7]. Зокрема, це відноситься до довжин осей інерції об'єкта.
Процес бінаризації пов'язаний з певними спотвореннями зображення, що негативно впливають на представлення дефекту. А саме виникають розриви і втрата цілісності зображення об'єктів внаслідок ряду причин, обумовлених структурою зображення: значною зональною нерівномірністю яскравості об'єкта; дотиком об'єктів зображення, коли частина контуру об'єкта втрачається при бінаризації, і об'єкт зливається із сусіднім; накладенням об'єктів зображення, що породжує проблему вибору порогу бінаризації [8]

Підходи до бінаризації умовно можна розділити на 2 групи:

  1. – порогові;
  2. – адаптивні.

Порогові методи бінаризації працюють з усім зображенням, знаходячи якусь характеристику (поріг), що дозволяє розділити всі зображення на чорне і біле [9].

Адаптивні методи працюють з ділянками зображень і використовуються при неоднорідному освітленні об'єктів 

'Висновки:'

Було досліджено алгоритми, що дозволяють ідентифікувати об’єкт та виявлено основні недоліки алгоритмів. Серед яких є проблема, коли камера може бачити відразу кілька об'єктів, спеціально розташованих поруч, або ж у полі зору може потрапити який-небудь сторонній об'єкт. Якщо не передбачати деяку розбивку загального зображення на частині, то жоден з описаних вище алгоритмів не зможе коректо працювати.
Деякі не здатні розпізнавати образи інваріантні щодо повороту без зовнішньої перед обробки. А застосування додаткових алгоритмів впливає на швидкодію комп’ютера. А, як відомо, потрібно визначити алгоритм, який визначає об’єкт не залежно від його кута повороту чи типу зображення.
Проаналізувавши всі алгоритми розпізнавання, описані вище, прийшли до висновку, що: необхідно працювати з растровим зображенням (так швидше одержати реальні результати). Працюючи із растровими зображеннями із застосуванням алгоритмів сегментацій та нейромережних структур, можна створити новий алгоритм, який буде значно швидшим і не заложитиме від класу об’єкту
Використані джерела:
  1. [1]. J. Erez, “Real time vehicle license plate recognition system”,http:/visl.technion.ac.il/projects/2002w03(2002)
  2. [2]. Swets, D.L Genetic algorithms for object recognition in a complex scene / (1995) Michigan State Univ., East Lansing, MI, USA ; Punch, B. ; Weng, J
  3. [3]. Milanese, M. and M. Taragna (2001). Optimality, approximation and complexity in set membership H∞ identificaton. Mimeo. hang, L. Chen, Y. Chung and S. Chen“Automatic license plate recognition”, IEEE Transactions on Intelligent Transportation Systems
    1. [4]

    . Kovac, J.. Human skin color clustering for face detection./ 2005р.H. S. Z. Li , Anil K. Jain Handbook of face recognition - Springer Science & Business, Comput. & Inf. Sci. Fac., Ljubljana Univ., Slovenia

    1. [5]. Neural network-based face detection - Rowley, Baluja, et al. - 1998
    2. [6]. A.K. Jain, P. Flynn, A.A. Ross, „Handbook of Biometrics“, ISBN 978-0387710402, Springer Verlag 2008
    3. [7]. J. Shotton, A. Blake, R. Cipolla, „Multi-Scale Categorical ObjectRecognition Using Contour Fragments“, IEEE Transactions on PatternAnalysis and Machine Intelligence (PAMI 2007), Vol.30, No.7, pp.1270-1281, 2008.
    4. [8]. F.J. Estrada, A.D. Jepson, and C. Chennubhotla. Spectral embedding and min-cut for image segmentation. In British Machine Vision Conference, 2004.
    5. [9]. Schneiderman, H. ; Robotics Inst., Carnegie Mellon Univ., Pittsburgh, PA, USA ; Kanade, T. Probabilistic modeling of local appearance and spatial relationships for object recognition. In British Machine Vision Conference, 2004.
    6. [10]. Мельник Р.А., Каличак Ю.І. “Пошук образів за силуетами яскравості зображень” Відбір і обробка інформації, Вип.32 (108), с. 86-92, 2010.