Andrya1991

Мет́оди сегм́ентації зобр́ажень із викор́истанням гіст́ограм
Методи сегментації зображень на основі використання гістограм є набагато ефективнішими у порівнянні з іншими методами, тому що вони вимагають тільки одноразового проходу по пікселях. У цьому методі гістограма обраховується по всіх пікселях зображення, а її мінімуми і максимуми використовуються, щоб знайти кластери на зображенні ^[1]. При цьому, колір або яскравість можуть використовуватися при порівнянні. Такі методи можуть покращені, якщо рекурсивно їх застосовувати до кластерів на зображенні, щоб поділити їх на ще дрібніші кластери. Процес повторюється з усе меншими і меншими кластерами до тих пір, поки не перестануть з'являтися нові кластери ^[1] ^[2].
Одним із недоліків цих методів є те, що може бути важко знайти значні відхилення мінімумів і максимумів зображення. У цих методах класифікації зображень схожими є метрика відстаней і зіставлення інтегрованих регіонів. Підходи, основані на використанні гістограм, можна також швидко адаптувати для декількох кадрів, зберігаючи свою перевагу в швидкості виконання за рахунок одного проходу. Гістограма може бути побудована кількома способами, коли розглядається послідовність кадрів. Той самий підхід, який використовується для одного кадру, може бути застосований для декількох, і після того, як результати об'єднаються, мінімуми і максимуми, які до того було складно виділити, стануть помітнішими. Гістограма також може бути застосована до кожного пікселя, де інформація використовується для визначення найчастішого кольору для даного розташування пікселя. Цей підхід використовує сегментацію, базовану на рухомих об'єктах і нерухомому оточенні, що дасть інший вид сегментації, корисний у відео трекінгу.

Означення

Пор́огова класиф́ікація зобр́аження (англ. Thresholding) – це найпростіший метод сегментації зображень, який використовується в процесі перетворення зображень із градацій сірого (англ. greyscaled) в бінаризовані (англ. binary images). Бінарні значення тут представляють об'єкти і тло зображення. Пікселі, значення яких перевищують встановлений поріг інтенсивності, відносять до однієї категорії, всі решта – до іншої. Приймемо поріг зображення за T ^[3].
Глоб́альна пор́огова класиф́ікація зобр́аження — один поріг використовується по всьому зображенні.
Гіст́ограма інтенс́ивності – це гістограма множини значень $X=x_{0},x_{1},...,x_{n}$ , де вісь $OX$ — це $n$ можливих градацій кольорів (зазвичай, $n=255$ градацій сірого кольору), вісь $OY$ — кількість пікселів кожної із градацій ( $x_{i}$ ).
Також далі по тексту використовуватимуться такі часткові суми:
$A_{j}=\sum _{i=0}^{j}*x_{i},j=\{{0,1,...,n}\}$ — сума значень інтенсивностей $x_{i}$ до $j$ —ої градації;
$B_{j}=\sum _{i=0}^{j}i*x_{i},j=\{{0,1,...,n}\}$ — сума добутків інтенсивностей $x_{i}$ та градацій $i$ до $j$ —ої градації;
$C_{j}=\sum _{i=0}^{j}i^{2}*x_{i},j=\{{0,1,...,n}\}$ — сума добутків інтенсивностей $xi$ та квадрату градацій $i^{2}$ до $j$ —ої градації;

Алгоритм знаходження мінімуму

Алгоритм знаходження мінімуму ^[4] використовує поняття бімодальності гістограми (англ. bimodal distribution). Принцип алгоритму полягає у згладжуванні гістограми (використовуючи трьохточковий фільтр середнього значення) ітеративно, доки гістограма буде мати лише 2 локальних максимуми.
Далі обирається таке $T$ , що $x_{i}-1>x_{i}\leqq x_{i}+1$
Недоліком цього алгоритму є те, що він не підходить для використання у зображеннях, гістограми яких мають мають сильно розрізнені значення точок максимумів або широкі і рівні мінімуми.

Алгоритм міжмодальності

Алгоритм міжмодальності ^[4] схожий до алгоритму знаходження мінімуму – він теж базується на використанні поняття бімодальності гістограми. Тут спочатку теж знаходиться значення двох локальних максимумів $x_{i}$ та $x_{k}$ . Тоді значення порогу $T=(j+k)/2$ .
Як і його попередник, алгоритм так само все ще не підходить для використання у зображеннях із гістограмами, які мають сильно розрізнені значення максимумів.

Алгоритм знаходження ввігнутостей гістограми

Якщо зображення має нечіткі межі між об'єктом і тлом, то алгоритми знаходження мінімального і міжмодального значень є неефективними. В такому разі значення порогу слід шукати на "плечі" гістограми. Місце розташування такого "плеча" можна доволі легко знайти відносно ввігнутості гістограми. В цьому алгоритмі спочатку будують опуклу оболонку $H$ гістограми $X$ . Після цього знаходять локальний максимум цієї оболонки. Далі шукають таке значення $T$ , при якому значення $b_{j}=A_{j}(A_{n}-A_{j})$ стане максимальним.
В більшості випадків ^[5] алгоритм дає добрі результати, проте інколи значення порогів є повністю не придатними для їх подальшого використання.

Алгоритм ймовірностей (PTile та медіани)

Цей алгоритм припускає, що нам відомо відсоток покриття пікселів об'єкта на картинці. Тут слід знайти таке максимальне значення $T$ яке покриватиме $(100-p)\%$ пікселів об’єкта на зображенні. Проте, цей алгоритм не підходить у випадку, коли площа, яку займає об’єкт на картинці, нам не відома ^[6].
Ще однією проблемою тут є те, що цей алгоритм є параметризованим: ми повинні вказати значення ймовірності $p$ , відповідно до якого буде здійснюватися пошук порогу. Але це можна легко обійти, задавши наперед значення $p=50$ , в результаті чого поріг $T$ стане медіаною розподілу ймовірностей пікселів.

Алгоритм знаходження середнього

Схожий на алгоритм знаходження медіани зображення. В цьому алгоритмі замість знаходження медіани шукають таке значення $T$ , яке буде цілою частиною середнього значення всіх пікселів. Це можна відобразити наступною формулою: $T={\frac {B_{n}}{A_{n}}}$ .
Проте цей алгоритм не враховує форму гістограми, що, очевидно, дасть прийнятні, але не найкращі результати.

Алгоритм знаходження моментів

Шукається таке значення $T$ , щоб бінаризоване зображення мало такі ж перші три свої моменти, як і зображення в градаціях сірого кольору ^[7].

Це досягається шляхом підбору значення $T$ таким чином, щоб дробова частина відношення $A_{T}/A_{n}$ була найближчою до $y_{0}$ , де

y_{0}={\frac {1}{2}}-{\frac {{\frac {B_{n}}{A_{n}}}+{\frac {y_{2}}{2}}}{\sqrt {y_{2}^{2}-4y_{1}}}},\;y_{1}={\frac {B_{n}D_{n}-C_{n}^{2}}{A_{n}C_{n}-B_{n}\cdot 2}},\;y_{2}={\frac {B_{n}C_{n}-A_{n}D_{n}}{A_{n}C_{n}-B_{n}^{2}}},\;D_{n}=\sum _{i=0}^{n}i^{2}y_{i}

Метод ентропій

Це один із декількох алгоритмів знаходження максимальної ентропії зображення. Алгоритм ділить гістограму зображення на два розподіли ймовірностей, одна з яких представляє об’єкт, а інша — тло. Далі шукається таке $T$ , що сума ентропій цих розподілів ймовірностей вийде максимальною ^[8].
Тут визначається часткова сума $E_{j}=\sum _{i=0}^{j}x_{i}\lg x_{i},j=\{{0,1,...,n}\}$ . Тоді значення $T$ буде таким значенням $j$ , при якому значення ${\frac {E_{j}}{A_{j}}}-\lg A_{j}+{\frac {E_{n}-E_{j}}{A_{n}-A_{j}}}-\lg A_{n}-A_{j}$ буде максимальним.

Алгоритм Отсу (міжкласового середнього)

Алгоритм Отсу намагається кластеризувати (сегментувати, поділити) зображення на об'єкт і тло таким чином, щоб кожен кластер був якомога більш внутрішньо зв’язаний, мінімізуючи їх області перекривання ^[9]. Спочатку визначається внутрішньокласове середньоквадратичне відхилення:

Файл:Відхилення.jpg

\omega _{B}(T)=\sum _{i=0}^{T}-1p(i),\omega _{0}(T)=\sum _{i=T}^{L}-1p(i),[0.L-1]

— кількість градацій сірого кольору

\sigma _{B}^{2}(T)

— середньоквадратичне відхилення пікселів тла

\sigma _{0}^{2}(T)

— середньоквадратичне відхилення пікселів об’єкта

Далі визначається послаблення взаємозв'язків між класами:

Файл:Послаблення.jpg

Далі шукається максимальне значення формули, що й дасть результуюче значення порогу $T$

Файл:Поріг.jpg

$\mu$ — середнє арифметичне;
$\sigma ^{2}$ — середньоквадратичне відхилення.
Перевагами цього алгоритму є його простота в реалізації і висока ефективність у випадках, коли різниця кількості пікселів між класами є мінімальною. Недоліком тут є те, що значення порогу виявиться неефективним критерієм подальшої бінаризації, коли кількість пікселів об'єкта і тла сильно розрізнена.

Примітки

↑ ^а ^б Linda G. Shapiro and George C. Stockman (2001): «Computer Vision», pp 279–325, New Jersey, Prentice-Hall, ISBN 0-13-030796-3
↑ Ron Ohlander, Keith Price, and D. Raj Reddy (1978): «Picture Segmentation Using a Recursive Region Splitting Method», Computer Graphics and Image Processing, volume 8, pp. 313–333
↑ Niemist'o, Antti (2004). "A comparison of nonparametric histogram-based thresholding algorithms", Digital Image Processing, volume 3, pp. 1-51.
↑ ^а ^б J. M. S. Prewitt and M. L. Mendelsohn, “The analysis of cell images,” in Ann. New York Acad. Sci., vol. 128, pp. 1035-1053, 1966
↑ A. Rosenfeld and P. De La Torre, “Histogram concavity analysis as an aid in threshold selection,” IEEE Trans. Systems Man Cybernet., vol. 13, pp. 231-235, 1983
↑ W. Doyle, “Operation useful for similarity-invariant pattern recognition,” J. Assoc. Comput. Mach, vol. 9, pp. 259-267, 1962.
↑ W. Tsai, “Moment-preserving thresholding: a new approach,” Comput. Vision Graphics Image Process., vol. 29, pp. 377-393, 1985
↑ J. N. Kapur, P. K. Sahoo, and A. K. C. Wong, “A new method for gray-level picture thresholding using the entropy of the histogram,” Comput. Vision Graphics Image Process., vol. 29, pp. 273-285, 1985
↑ N. Otsu, “A threshold selection method from gray-level histogram,” IEEE Trans. Systems Man Cybernet., vol. 9, pp. 62-66, 1979

[CV-1] а ^б Linda G. Shapiro and George C. Stockman (2001): «Computer Vision», pp 279–325, New Jersey, Prentice-Hall, ISBN 0-13-030796-3

[2] Ron Ohlander, Keith Price, and D. Raj Reddy (1978): «Picture Segmentation Using a Recursive Region Splitting Method», Computer Graphics and Image Processing, volume 8, pp. 313–333

[3] Niemist'o, Antti (2004). "A comparison of nonparametric histogram-based thresholding algorithms", Digital Image Processing, volume 3, pp. 1-51.

[AOCI-4] а ^б J. M. S. Prewitt and M. L. Mendelsohn, “The analysis of cell images,” in Ann. New York Acad. Sci., vol. 128, pp. 1035-1053, 1966

[5] A. Rosenfeld and P. De La Torre, “Histogram concavity analysis as an aid in threshold selection,” IEEE Trans. Systems Man Cybernet., vol. 13, pp. 231-235, 1983

[6] W. Doyle, “Operation useful for similarity-invariant pattern recognition,” J. Assoc. Comput. Mach, vol. 9, pp. 259-267, 1962.

[7] W. Tsai, “Moment-preserving thresholding: a new approach,” Comput. Vision Graphics Image Process., vol. 29, pp. 377-393, 1985

[8] J. N. Kapur, P. K. Sahoo, and A. K. C. Wong, “A new method for gray-level picture thresholding using the entropy of the histogram,” Comput. Vision Graphics Image Process., vol. 29, pp. 273-285, 1985

[9] N. Otsu, “A threshold selection method from gray-level histogram,” IEEE Trans. Systems Man Cybernet., vol. 9, pp. 62-66, 1979

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]