В обробці зображень виявля́ння хребті́в (англ. ridge detection) — це намагання за допомогою програмного забезпечення знаходити в зображенні хребти́ (англ. ridges), визначені як криві, чиї точки є локальними максимумами функції, схожі на географічні хребти.

Для функції N змінних її хребти — це множина кривих, чиї точки є локальними максимумами в N − 1 вимірах. У цьому відношенні поняття точок хребта розширює поняття локального максимуму. Відповідно, поняття доли́н (англ. valleys) для функції можна визначити, замінивши умову локального максимуму умовою локального мінімуму. Об'єднання множин хребтів і множин долин, разом із пов'язаною множиною точок, званою множино́ю сполу́чників (англ. connector set), утворюють зв'язну множину кривих, які розбиваються, перетинаються або зустрічаються в критичних точках функції. Це спільне об'єднання множин називають відносною крити́чною множино́ю (англ. relative critical set) функції.[1][2]

Множини хребтів, множини долин і відносні критичні множини подають важливу геометричну інформацію, притаманну функції. Певним чином вони забезпечують компактне подання важливих ознак функції, але питання про те, наскільки їх можливо використовувати, щоби визначати глобальні ознаки функції, залишається відкритим. Основна мотивація для створення процедур виявля́ння хребті́в і виявля́ння доли́н походить з аналізу зображень[en] та комп'ютерного бачення, і полягає у вловлюванні внутрішностей видовжених об'єктів в області зображення. Пов'язані з хребтами подання в термінах вододілів[en] використовували для сегментування зображень. Були також спроби вловлювати форми об'єктів за допомогою графових подань, що відображують хребти, долини та критичні точки в області зображення. Проте такі уявлення можуть бути дуже чутливими до шуму, якщо обчислюються лише в одному масштабі. Оскільки обчислення теорії простору масштабів залучають згортку гауссовим (згладжувальним) ядром, сподівалися, що використання багатомасштабових хребтів, долин та критичних точок у контексті теорії простору масштабів дозволить забезпечувати надійніше подання об'єктів (або форм) у зображенні.

У цьому відношенні хребти та долини можливо розглядати як доповнення до природних особливих точок або точок локальних екстремумів. За належно визначених понять, хребти та долини в ландшафті яскравості (або в якомусь іншому поданні, отриманому з ландшафту яскравості) можуть утворювати масштабоінваріантний кістяк для утворення просторових обмежень на локальний вигляд з низкою якісних подібностей до того, як серединноосьове перетворення Блюма забезпечує кістяк форми для бінарних зображень. У типових застосуваннях описувачі хребтів і долин часто використовують для виявляння доріг на аерофотознімках та для виявляння кровоносних судин на зображеннях очного дна[en] чи тривимірних магнітно-резонансних зображеннях.

Диференціальногеометричне визначення хребтів і долин у фіксованому масштабі на двовимірному зображенні ред.

Нехай   позначує двовимірну функцію, і нехай   буде масштабопросторовим поданням  , отриманим згортанням   гауссовою функцією

 .

Крім того, нехай   та   позначують власні значення матриці Гессе

 

масштабопросторового подання   з перетворенням координат (повертанням), застосованим до операторів локальних напрямних похідних,

 

де p та q — координати повернутої системи координат.

Можливо показати, що змішана похідна   у перетвореній системі координат нульова, якщо ми оберемо

 ,  .

Тоді формальне диференціальногеометричне визначення хребтів   у фіксованому масштабі   може бути виражено як набір точок, які задовольняють[3]

 

Відповідно, долини   в масштабі   — множина точок

 

В системі координат   з напрямком  , паралельним градієнтові зображення,

 

де

 

можливо показати, що це визначення хребтів і долин можливо натомість еквівалентно[4] записати як

 

де

 
 
 

а знак   визначає полярність;   для хребтів і   для долин.

Розрахунок хребтів змінного масштабу з двовимірних зображень ред.

Основна проблема поданого вище визначення хребта фіксованого масштабу полягає в тому, що воно може бути дуже чутливим до вибору рівня масштабу. Експерименти показують, що параметр масштабу гауссового ядра попереднього згладжування мусить бути ретельно підлаштовано до ширини хребтової структури в області зображення, щоби виявляч хребтів створював зв'язану криву, яка відображувала би структури в основі зображення. Для розв'язання цієї проблеми за відсутності попередньої інформації було введено поняття масштабопросторових хребтів (англ. scale-space ridges), яке розглядає параметр масштабу як невід'ємну властивість визначення хребта й дозволяє рівням масштабу змінюватися вздовж масштабопросторового хребта. Більше того, концепція масштабопросторового хребта також дозволяє підлаштовувати параметр масштабу до ширини хребтових структур в області зображення автоматично, фактично як наслідок добре сформульованого визначення. У літературі на основі цієї ідеї було запропоновано низку різних підходів.

Нехай   позначує міру вираженості хребта (яку буде вказано нижче). Тоді для двовимірного зображення масштабопросторовий гребінь — це множина точок, які задовольняють

 

де   — параметр масштабу в масштабопросторовому поданні. Аналогічно, масштабопросторова долина (англ. scale-space valley) — це множина точок, які задовольняють

 

Безпосереднім наслідком цього визначення є те, що для двовимірного зображення концепція масштабопросторових хребтів вимітає множину одновимірних кривих у тривимірному просторі масштабів, де параметрові масштабу дозволено змінюватися вздовж масштабопросторового хребта (чи масштабопросторової долини). Описувачем хребта в області зображення тоді буде проєкція цієї тривимірної кривої на двовимірну площину зображення, де інформацію про властивий масштаб у кожній точці хребта можливо використовувати як природну оцінку ширини хребтової структури в області зображення в околі цієї точки.

У літературі пропонують різні міри хребтової вираженості. Коли Ліндеберг (1996, 1998)[5] запровадив термін «масштабопросторовий хребет», він розглядав три міри хребтової вираженості:

  • Основна головна кривина
 
виражена в термінах  -нормованих похідних через
 .
  • Квадрат різниці квадратів  -нормованих власних значень
 
  • Квадрат різниці  -нормованих власних значень
 

Поняття  -нормованих похідних тут важливе, оскільки дозволяє алгоритмам виявляння хребтів і долин належно калібруватися. З вимоги, щоби для одновимірного гауссового хребта, вкладеного в два (або три) виміри, масштаб виявляння дорівнював ширині хребтової структури при вимірюванні в одиницях довжини (вимога відповідності між розмірами фільтра виявляння та структурою зображення, на яку він реагує), випливає, що слід обирати  . З цих трьох мір вираженості хребта перша сутність   є мірою вираженості хребта загального призначення з багатьма застосуваннями, такими як виявляння кровоносних судин і виділяння доріг. Проте сутність   використовували в таких застосуваннях як покращення відбитків пальців,[6] відстежування рук[en] та розпізнавання жестів[en] у реальному часі,[7] а також для моделювання локальних статистик зображень для виявляння та відстежування людей у зображеннях та відео.[8]

Існують також й інші тісно пов'язані визначення хребта, які використовують нормовані похідні з неявним припущенням  .[9] Проробити ці підходи докладніше. Проте при виявлянні хребтів з   масштаб виявляння буде вдвічі більшим, аніж для  , що призводить до більших викривлень форми та нижчої здатності вловлювати хребти та долини з сусідніми завадними структурами зображення в його області.

Історія ред.

Поняття хребтів і долин у цифрових зображеннях було запроваджено Гараліком[en] 1983 року[10] та Кроулі стосовно пірамід різниць гауссіанів 1984 року.[11][12] Застосування хребтових описувачів до аналізу медичних зображень було детально досліджено Пайзером та його співробітниками,[13][14][15] давши їхнє поняття M-подань (англ. M-reps).[16] Ліндеберг також посприяв розвитку виявляння хребтів, запровадивши  -нормовані похідні та масштабопросторові хребти, визначені з локальної максимізації належним чином нормованої головної кривини матриці Гессе (або інших мір вираженості хребта) над простором та над масштабом. Ці поняття пізніше було розвинуто із застосуванням до виділяння доріг Стегером та ін.[17][18] та до сегментування кровоносних судин за Франджі та ін.,[19] а також для виявлення криволінійних і трубчастих структур Сато та ін.[20] та Крисяном та ін.[21] Огляд кількох класичних визначень хребтів у фіксованому масштабі, включно з відношеннями між ними, було запропоновано Кендерінком та ван Дорном.[22] Огляд методів виділяння судин було запропоновано Кірбасом та Квеком.[23]

Визначення хребтів і долин у N вимірах ред.

У своєму найширшому сенсі поняття хребта узагальнює уявлення про локальний максимум дійсної функції. Точка   в області визначення функції   є локальним максимумом цієї функції, якщо існує відстань  , така, що якщо   знаходиться всередині   одиниць від  , то  . Добре відомо, що критичні точки, для яких локальні максимуми є лише одним з їхніх типів, це ізольовані точки в області визначення функції у всіх ситуаціях, окрім найнезвичніших (тобто незагальних випадків).

Розгляньмо деяке послаблення умови   для   у всьому околі   до вимоги лише того, щоби вона дотримувалася в  -вимірній підмножині. Імовірно, це послаблення дозволяє множині точок, що задовольняють цей критерій, які ми назвемо хребтом, мати один ступінь свободи, принаймні в загальному випадку. Це означає, що множина точок хребта утворюватиме одновимірне геометричне місце точок, або криву хребта (англ. ridge curve). Зверніть увагу, що вищезазначене можливо видозмінити, узагальнивши це уявлення до локальних мінімумів й отримавши те, що можна було би назвати одновимірними кривими долин.

Наступне визначення хребта відповідає книзі Еберлі,[24] й його можливо розглядати як узагальнення деяких із вищезгаданих. Нехай   — відкрита множина, а   гладенька. Нехай  . Нехай   — градієнт   в  , і нехай   — матриця Гессе   функції   в  . Нехай   — це   впорядкованих власних значень  , і нехай   — одиничний власний вектор у власному просторі для  . (Для цього слід виходити з відмінності всі власних значень.)

Точка   є точкою на 1-вимірному хребті  , якщо виконуються такі умови:

  1.  , і
  2.   для  .

Це уточнює поняття, що  , обмежена цим конкретним  -вимірним підпростором, має локальний максимум в  .

Це визначення природно узагальнюється на k -вимірний хребет наступним чином: точка   є точкою на k-вимірному хребті  , якщо виконуються наступні умови:

  1.  , і
  2.   для  .

Багато в чому ці визначення природно узагальнюють визначення локального максимуму функції. Властивості гребнів максимальної опуклості (англ. maximal convexity ridges) покладено на тверду математичну основу Деймоном[1] та Міллером.[2] Їхні властивості в однопараметрових сімействах було визначено Келлером.[25]

Максимальномасштабовий хребет ред.

Наступне визначення можливо простежити до Фріча,[26] який цікавився виділянням геометричної інформації про фігури у двовимірних зображеннях у відтінках сірого. Фріч обробляв своє зображення фільтром «серединності» (англ. "medialness"), який давав йому інформацію, аналогічну даним «віддаленості від меж» (англ. "distant to the boundary") у просторі масштабів. Хребти цього зображення, проєктовані на первинне зображення, мали бути аналогічними кістякові форми (наприклад, блюмовій серединній осі) первинного зображення.

Далі наведено визначення максимальномасштабового хребта (англ. maximal scale ridge) функції трьох змінних, однією з яких є параметр «масштаб». Одне, чого ми хочемо дотриматися в цьому визначенні, це якщо   — точка на цьому хребті, то значення цієї функції в ній максимальне за виміром масштабу. Нехай   — гладенька диференційована функція  .   — точка на максимальномасштабовому хребті тоді й лише тоді, коли

  1.   і  , і
  2.   і  .

Взаємозв'язок між виявлянням контурів та виявлянням хребтів ред.

Метою виявляння хребтів зазвичай є вловлювання головної осі симетрії видовженого об'єкта,[джерело?] тоді як мета виявляння контурів зазвичай полягає у вловлюванні межі об'єкта. Проте деяка література з виявляння контурів помилково[джерело?] відносить поняття хребтів до поняття контурів, що заплутує ситуацію.

З точки зору визначень, між виявлячами контурів та виявлячами хребтів існує тісний зв'язок. З формулюванням не-максимуму, наведеним Кенні,[27] стверджується, що контури визначаються як точки, де величина градієнта набуває локального максимуму в напрямі градієнта. Дотримуючись диференціальногеометричного способу вираження цього визначення,[28] ми можемо у вищезгаданій системі координат   стверджувати, що величина градієнта масштабопросторового подання, яка дорівнює похідній за напрямом першого порядку в напрямі  ,  , повинна мати свою напрямну похідну першого порядку в напрямі   рівною нулеві

 

тоді як напрямна похідна другого порядку   в напрямі   має бути від'ємною, тобто

 .

Записане як явний вираз у термінах локальних частинних похідних  ,   , це визначення контуру можливо виразити у вигляді кривих, які перетинають нуль, диференціального інваріанта

 

що задовольняють знакові умові на наступному диференціальному інваріанті

 

(додаткову інформацію див. у статті про виявляння контурів). Примітно, що отримані таким чином контури є хребтами величини градієнта.

Див. також ред.

Примітки ред.

  1. а б Damon, J. (March 1999). Properties of Ridges and Cores in Two-Dimensional Images. J Math Imaging Vis. 10 (2): 163—174. doi:10.1023/A:1008379107611. (англ.)
  2. а б Miller, J. Relative Critical Sets in   and Applications to Image Analysis. Ph.D. Dissertation. University of North Carolina. 1998. (англ.)
  3. T. Lindeberg (2009). Scale-space. У Benjamin Wah (ред.). Encyclopedia of Computer Science and Engineering. Т. IV. John Wiley and Sons. с. 2495—2504. doi:10.1002/9780470050118.ecse609. ISBN 978-0470050118. Архів оригіналу за 15 травня 2022. Процитовано 15 травня 2022. (англ.)
  4. Lindeberg, T (1994). Scale-space theory: A basic tool for analysing structures at different scales. Journal of Applied Statistics. 21 (2): 224—270. doi:10.1080/757582976. Архів оригіналу за 15 травня 2022. Процитовано 15 травня 2022. (англ.)
  5. Lindeberg, T. (1998). Edge detection and ridge detection with automatic scale selection. International Journal of Computer Vision. 30 (2): 117—154. doi:10.1023/A:1008097225773. Ранішу версію подано на конференції IEEE з розпізнавання образів та комп'ютерного бачення, CVPR'96, Сан-Франциско, Каліфорнія, с. 465—470, червень 1996 (англ.)
  6. Almansa, A., Lindeberg, T. (2000). Fingerprint Enhancement by Shape Adaptation of Scale-Space Operators with Automatic Scale-Selection. IEEE Transactions on Image Processing. 9 (12): 2027—42. Bibcode:2000ITIP....9.2027L. doi:10.1109/83.887971. PMID 18262941. Архів оригіналу за 15 травня 2022. Процитовано 15 травня 2022. (англ.)
  7. L. Bretzner, I. Laptev and T. Lindeberg: Hand Gesture Recognition using Multi-Scale Colour Features, Hierarchical Models and Particle Filtering, Proc. IEEE Conference on Face and Gesture 2002, Washington DC, 423–428. [Архівовано 15 травня 2022 у Wayback Machine.] (англ.)
  8. Sidenbladh, H., Black, M. (2003). Learning the statistics of people in images and video (PDF). International Journal of Computer Vision. 54 (1–2): 183—209. doi:10.1023/a:1023765619733. Архів оригіналу (PDF) за 5 липня 2017. Процитовано 15 травня 2022. (англ.)
  9. J. Furst and J. Miller, "The Maximal Scale Ridge: Incorporating Scale in the Ridge Definition [Архівовано 15 травня 2022 у Wayback Machine.]", Scale Space Theory in Computer Vision: Proceedings of the First International Conference on, Scale Space '97, pp. 93–104. Springer Lecture Notes in Computer Science, vol. 1682. (англ.)
  10. Haralick, R. (April 1983). Ridges and Valleys on Digital Images. Computer Vision, Graphics, and Image Processing. 22 (10): 28—38. doi:10.1016/0734-189X(83)90094-4. (англ.)
  11. Crowley, J.L., Parker, A.C.[en] (March 1984). A Representation for Shape Based on Peaks and Ridges in the Difference of Low Pass Transform (PDF). IEEE Trans Pattern Anal Mach Intell. 6 (2): 156—170. CiteSeerX 10.1.1.161.3102. doi:10.1109/TPAMI.1984.4767500. PMID 21869180. Архів оригіналу (PDF) за 3 березня 2016. Процитовано 15 травня 2022. (англ.)
  12. Crowley, J.L., Sanderson, A. (January 1987). Multiple Resolution Representation and Probabilistic Matching of 2-D Gray-Scale Shape (PDF). IEEE Trans Pattern Anal Mach Intell. 9 (1): 113—121. CiteSeerX 10.1.1.1015.9294. doi:10.1109/TPAMI.1987.4767876. PMID 21869381. Архів оригіналу (PDF) за 30 серпня 2017. Процитовано 15 травня 2022. (англ.)
  13. Gauch, J.M., Pizer, S.M. (June 1993). Multiresolution Analysis of Ridges and Valleys in Grey-Scale Images. IEEE Trans Pattern Anal Mach Intell. 15 (6): 635—646. doi:10.1109/34.216734. (англ.)
  14. Eberly D.; Gardner R.; Morse B.; Pizer S.; Scharlach C. (December 1994). Ridges for image analysis. Journal of Mathematical Imaging and Vision. 4 (4): 353—373. doi:10.1007/BF01262402. (англ.)
  15. Pizer, Stephen M., Eberly, David, Fritsch, Daniel S. (January 1998). Zoom-invariant vision of figural shape: the mathematics of cores. Computer Vision and Image Understanding. 69 (1): 55—71. CiteSeerX 10.1.1.38.3116. doi:10.1006/cviu.1997.0563. (англ.)
  16. S. Pizer, S. Joshi, T. Fletcher, M. Styner, G. Tracton, J. Chen (2001) "Segmentation of Single-Figure Objects by Deformable M-reps", Proceedings of the 4th International Conference on Medical Image Computing and Computer-Assisted Intervention, Springer Lecture Notes In Computer Science; Vol. 2208, pp. 862–871 [Архівовано 10 березня 2007 у Wayback Machine.] (англ.)
  17. Steger C. (1998). An unbiased detector of curvilinear structures. IEEE Trans Pattern Anal Mach Intell. 20 (2): 113—125. CiteSeerX 10.1.1.42.2266. doi:10.1109/34.659930. (англ.)
  18. Laptev I.; Mayer H.; Lindeberg T.; Eckstein W.; Steger C.; Baumgartner A. (2000). Automatic extraction of roads from aerial images based on scale-space and snakes (PDF). Machine Vision and Applications. 12 (1): 23—31. doi:10.1007/s001380050121. Архів оригіналу (PDF) за 15 квітня 2021. Процитовано 15 травня 2022. (англ.)
  19. Frangi AF, Niessen WJ, Hoogeveen RM, van Walsum T, Viergever MA (October 1999). Model-based quantitation of 3-D magnetic resonance angiographic images. IEEE Trans Med Imaging. 18 (10): 946—56. CiteSeerX 10.1.1.502.5994. doi:10.1109/42.811279. PMID 10628954. (англ.)
  20. Sato Y, Nakajima S, Shiraga N, Atsumi H, Yoshida S та ін. (1998). Three-dimensional multi-scale line filter for segmentation and visualization of curvilinear structures in medical images (PDF). Medical Image Analysis. 2 (2): 143—168. doi:10.1016/s1361-8415(98)80009-1. PMID 10646760. Архів оригіналу (PDF) за 24 березня 2018. Процитовано 15 травня 2022. (англ.)
  21. Krissian K.; Malandain G.; Ayache N.; Vaillan R.; Trousset Y. (2000). Model-based detection of tubular structures in 3D images. Computer Vision and Image Understanding. 80 (2): 130—171. doi:10.1006/cviu.2000.0866. (англ.)
  22. Koenderink, Jan J., van Doorn, Andrea J. (May 1994). 2+1-D differential geometry. Pattern Recognition Letters. 15 (5): 439—443. doi:10.1016/0167-8655(94)90134-1. (англ.)
  23. Kirbas C, Quek F (2004). A review of vessel extraction techniques and algorithms (PDF). ACM Computing Surveys. 36 (2): 81—121. CiteSeerX 10.1.1.460.8544. doi:10.1145/1031120.1031121.{{cite journal}}: Обслуговування CS1: Сторінки з параметром url-status, але без параметра archive-url (посилання) (англ.)
  24. Eberly, D. (1996). Ridges in Image and Data Analysis. Kluwer. ISBN 978-0-7923-4268-7. (англ.)
  25. Kerrel, R. Generic Transitions of Relative Critical Sets in Parameterized Families with Applications to Image Analysis. University of North Carolina. 1999. (англ.)
  26. Fritsch, DS, Eberly,D., Pizer, SM, and McAuliffe, MJ. "Stimulated cores and their applications in medical imaging." Information Processing in Medical Imaging, Y. Bizais, C Barillot, R DiPaola, eds., Kluwer Series in Computational Imaging and Vision, pp. 365–368. (англ.)
  27. Canny J. (1986). A computational approach to edge detection. IEEE Trans Pattern Anal Mach Intell. 8 (6): 679—698. doi:10.1109/TPAMI.1986.4767851. PMID 21869365. (англ.)
  28. Lindeberg T. (1993). Discrete Derivative Approximations with Scale-Space Properties: A Basis for Low-Level Feature Extraction. Journal of Mathematical Imaging and Vision. 3 (4): 349—376. doi:10.1007/BF01664794. Архів оригіналу за 15 травня 2022. Процитовано 15 травня 2022. (англ.)