Штучна нейронна мережа: відмінності між версіями

[перевірена версія][перевірена версія]
Вилучено вміст Додано вміст
вікіфікація
Рядок 115:
Нейромережеві моделі можна розглядати як прості математичні моделі, що визначають функцію <math>\textstyle f : X \rightarrow Y </math>, або розподіл над <math>\textstyle X</math>, або над <math>\textstyle X</math> та <math>\textstyle Y</math>. Іноді моделі тісно пов'язують з певним правилом навчання. Поширене використання фрази «модель ШНМ» насправді є визначенням ''класу'' таких функцій (де членів цього класу отримують варіюванням параметрів, ваг з'єднань, або особливостей архітектури, таких як число нейронів або їхня зв'язність).
 
З математичної точки зору, нейромережеву функцію <math>\textstyle f(x)</math> визначають як композицію інших функцій <math>\textstyle g_i(x)</math>, які може бути розкладено далі на інші функції. Це може бути зручно представляти як мережеву структуру, де стрілки зображують залежність між функціями. Широко вживаним способом компонування є ''нелінійна зважена сума'', де <math>\textstyle f (x) = K \left(\sum_i w_i g_i(x)\right) </math>, де <math>\textstyle K</math> (що часто називають [[Функція збудження|функцією збудження]], {{lang-en|activation function}}<ref>{{cite web|url=http://www.cse.unsw.edu.au/~billw/mldict.html#activnfn|title=The Machine Learning Dictionary}} {{ref-en}}</ref>) є визначеною наперед функцією, такою як [[гіперболічний тангенс]], або [[сигмоїдна функція]], або [[нормована експоненційна функція]], або [[Випрямляч (нейронні мережі)|випрямляльна функція]]. Важливою характеристикою функції збудження є те, що вона забезпечує плавний перехід при зміні значень входу, тобто, невелика зміна входу призводить до невеликої зміни виходу. Наведене нижче розглядає набір функцій <math>\textstyle g_i</math> як {{нп|[[Вектор (математика та фізика)|вектор||Vector (mathematics and physics)}}]] <math>\textstyle g = (g_1, g_2, \ldots, g_n)</math>.
 
[[Файл:Ann dependency (graph).svg|thumb|150px|Граф залежностей ШНМ]]