Відкрити головне меню

Виділяння ознак

(Перенаправлено з Виділення ознак)

В машинному навчанні, розпізнаванні образів та в обробці зображень виділя́ння озна́к (англ. feature extraction) починається з первинного набору даних вимірювань, і будує похідні значення (ознаки), покликані бути інформативними та ненадлишковими, полегшувати наступні кроки навчання та узагальнення, і в деяких випадках вести до кращих тлумачень людьми. Виділяння ознак пов'язане зі зниженням розмірності.

Коли вхідні дані алгоритму є занадто великими, щоби їх можливо було обробити, і підозрюються на надлишковість (наприклад, одні й ті самі вимірювання як у метрах, так і в футах, або повторюваності в зображеннях, представлених пікселями), тоді їх може бути перетворено на скорочений набір ознак (що також називають вектором ознак). Цей процес називається виділянням ознак. Очікується, що виділені ознаки містять доречну інформацію з вхідних даних, так що бажане завдання може бути виконано із застосуванням цього скороченого представлення замість повних первинних даних.

Зміст

ЗагальнеРедагувати

Виділяння ознак включає зниження кількості ресурсів, необхідних для опису великого набору даних. При виконанні аналізу складних даних одна з головних проблем випливає з кількості залучених змінних. Аналіз із великою кількістю змінних в загальному випадку вимагає великої кількості пам'яті та обчислювальних потужностей, або алгоритмів класифікації, що перенавчаються тренувальної вибірки, й погано узагальнюються на нові. Виділяння ознак є загальним терміном для позначення методів побудови таких поєднань змінних, щоби обходити ці проблеми, зберігаючи достатню точність опису даних.

Найкращі[джерело?] результати досягаються тоді, коли фахівець будує набір залежних від конкретного застосування ознак, процес, що називається проектуванням ознак. Але як би там не було, якщо такі фахові знання відсутні, допомогти можуть і загальні методики зниження розмірності. Вони включають:

Обробка зображеньРедагувати

Однією з дуже важливих областей застосування є обробка зображень, у якій застосовуються алгоритми для виявлення та виокремлення різних бажаних частин або фігур (ознак) оцифрованого зображення або потоку відео. Це особливо важливо в області оптичного розпізнавання символів.

НизькорівневаРедагувати

КривинаРедагувати

Рух зображенняРедагувати

На основі фігурРедагувати

Гнучкі методиРедагувати

  • Параметризовані фігури, що піддаються деформації
  • Активні контури (змії)

Виділяння ознак у програмному забезпеченніРедагувати

Багато програмних пакетів аналізу даних[en] забезпечують виявляння ознак та зниження розмірності. Поширені середовища чисельного програмування, такі як MATLAB, SciLab, NumPy та мова програмування R, забезпечують деякі з простіших методик виявляння ознак (наприклад, метод головних компонент) через вбудовані команди. Специфічніші алгоритми часто доступні як загальнодоступні сценарії або додатки від третіх сторін.

Див. такожРедагувати

ПриміткиРедагувати