Юрген Шмідхубер

Швейцарський кібернетик
Немає перевірених версій цієї сторінки; ймовірно, її ще не перевіряли на відповідність правилам проекту.

Юрген Шмідхубер (нім. Jürgen Schmidhuber народився 17 січня 1963, Мюнхен, ФРН)[9] — німецький і швейцарський вчений, фахівець у галузі штучного інтелекту. Є со-директором інституту досліджень штучного інтелекту Далле Молле[en] в Манно (кантон Тичино) у Південній Швейцарії. Виходячи з даних Google Scholar, з 2016 по 2021 його процетували понад 100 000 разів. Його називають «батьком штучного інтелекту», однак сам він вважає «батьком штучного інтелекту» Івахненко Олексія Григоровича.[10]

Юрген Шмідхубер
нім. Jürgen Schmidhuber
Народився17 січня 1963(1963-01-17)[1][2] (61 рік)
Мюнхен, Німеччина[2]
Країна Німеччина[3]
Діяльністьінформатик, дослідник штучного інтелекту, викладач університету, співзасновник
ГалузьШІ[4]
Alma materМюнхенський технічний університет (1991)
Науковий ступіньдокторський ступінь[2] (1991)
Науковий керівникWilfried Brauerd[5][2] і Клаус Шультен[5][2]
Знання мовнімецька[2] і англійська[2]
ЗакладІнститут дослідження штучного інтелекту Далле Моллеd[4][6], Мюнхенський технічний університет і USI[7]
ЧленствоЄвропейська академія наук і мистецтв і European Laboratory for Learning and Intelligent Systemsd[8]
Посадаад'юнкт[7][2]
Нагороди

Шмідхубер закінчив Мюнхенський технічний університет і з 2004 по 2009 роки обіймав у рідному університеті посаду професора когнітивної робототехніки.[9] В 2009 він стає професором штучного інтелекту в Університеті Лугано в Швейцарії.

Робота

ред.

Шмідхубер разом зі своїми учнями Сеппом Хохрайтером[en], Феликсом Герсом[en], та іншими, працювали над більш складною версією рекурентної нейронної мережі, яку автори назвали «Довга короткострокова пам'ять» (LTSM). Перші результати були представлені в дипломній роботі Хохрайтера (1991 рік), в якій аналізувалась та вирішувалась відома проблема зникання градієнта.[11] Назва LSTM була введена в технічний звіт (1995 рік), що призвело до найбільш цитованої публікації LSTM (1997).[12]

Стандартна архітектура LSTM, яка використовується майже у всіх сучасних додатках, була представлена у 2000 році.[13] Теперішній «ванільний LSTM», який використовує зворотне поширення в часі, був опублікований у 2005 році[14][15] та його навчальний алгоритм тимчасової коннекціоністської класифікації (CTC)[en]. У 2006 році в CTC з'явилась можливість розпізнавання мови за допомогою LSTM. У 2015 році LSTM, навчений за допомогою CTC, був використаний у новій реалізації розпізнавання мовлення у програмному забезпеченні Google для смартфонів. Google також використовував LSTM для розумного помічника Allo[16] та для Google Translate.[17] Apple використовувала LSTM для функції «Quicktype» на iPhone[18][19] та для Siri.[20] Amazon використовував LSTM для Amazon Alexa.[21] У 2017 році Facebook виконував приблизно 4,5 мільярда автоматичних перекладів щодня за допомогою LSTM.[22] Бізнес-тиждень Bloomberg писав: «Ці здібності роблять LSTM, можливо, найбільш комерційним досягненням штучного інтелекту, який використовується для всього, від прогнозування захворювань до створення музики».[23]

У 2011 році команда Шмідхубера в IDSIA[en] з його постдоком Деном Сіресаном також досягла різкого прискорення роботи згорткових нейронних мереж (CNN) на швидких паралельних комп'ютерах, які називаються графічними процесорами (GPU). Раніше CNN, який застосовувався на GPU від Chellapilla et al. (2006), був в 4 рази швидше, ніж еквівалентна реалізація на центральному процесорі (ЦП).[24] Глибокий CNN Дена Сіресана та ін. (2011) в IDSIA був в 60 разів швидше[25] і досяг першого надлюдського результату на конкурсі комп'ютерного зору в серпні 2011 року.[26] У період з 15 травня 2011 року по 10 вересня 2012 року їх швидкий та глибокий CNN виграв не менше чотирьох конкурсів зображень.[27] Вони також значно покращили найкращі показники в літературі для кількох баз даних зображень. Цей підхід став центральним у сфері комп'ютерного зору.

Дослідження Шмідхубера також включають генералізацію колмогорівської складності та метрики «швидкість важлива» (Speed Prior[en]), створення концепції машини Геделя[en].

У 2014 році Шмідхубер заснував компанію Nnaisense для роботи у сфері комерційного застосування технологій штучного інтелекту у таких галузях як фінанси, важка промисловість та безпілотні автомобілі. Сепп Хохрайтер[en] та Яан Таллінн займають у компанії посаду радників. У 2016 році продажі становили менше 11 мільйонів доларів США; проте Шмідхубер стверджує, що нині акцент робиться на дослідженнях, а не на доходах. Nnaisense залучила перше фінансування в січні 2017 року. Загальна мета Шмідхубера — створити універсальний штучний інтелект шляхом навчання одного ШІ послідовно для виконання різноманітних вузьких завдань.

Визнання

ред.

У 2013 році Шмідхубер отримав Приз Гельмгольца від Міжнародного товариства нейронних мереж та Нагороду Піонера Нейронних Мереж від Товариства обчислювального інтелекту IEEE[fr] у 2016. Шмідхубер є членом Європейської академії наук та мистецтв.

Примітки

ред.
  1. Munzinger Personen
  2. а б в г д е ж и https://people.idsia.ch/~juergen/cv.html
  3. https://people.idsia.ch/~juergen/life/
  4. а б http://nyti.ms/2g8hxWt
  5. а б Математичний генеалогічний проєкт — 1997.
  6. http://people.idsia.ch/~juergen/life/
  7. а б https://www.supsi.ch/idsia_en/institute/people/academic-staff.html
  8. https://ellis.eu/members
  9. а б CV. Архів оригіналу за 13 листопада 2020. Процитовано 2 липня 2017.
  10. Schmidhuber, Jurgen. Critique of Paper by "Deep Learning Conspiracy". (Nature 521 p 436) (англ.). Процитовано 26 грудня 2019.
  11. Hochreiter, S. (1991). Untersuchungen zu dynamischen neuronalen Netzen (PDF) (diploma thesis). Technical University of Munich, Institute of Computer Science (advisor Jürgen Schmidhuber) (PDF).
  12. Sepp Hochreiter; Jürgen Schmidhuber (1997). "Long short-term memory". Neural Computation. 9 (8): 1735–1780. doi:10.1162/neco.1997.9.8.1735. PMID 9377276. S2CID 1915014.
  13. Felix A. Gers; Jürgen Schmidhuber; Fred Cummins (2000). "Learning to Forget: Continual Prediction with LSTM". Neural Computation. 12 (10): 2451–2471. CiteSeerX 10.1.1.55.5709. doi:10.1162/089976600300015015. PMID 11032042. S2CID 11598600.
  14. Graves, A.; Schmidhuber, J. (2005). "Framewise phoneme classification with bidirectional LSTM and other neural network architectures". Neural Networks. 18 (5–6): 602–610. CiteSeerX 10.1.1.331.5800. doi:10.1016/j.neunet.2005.06.042. PMID 16112549.
  15. Klaus Greff; Rupesh Kumar Srivastava; Jan Koutník; Bas R. Steunebrink; Jürgen Schmidhuber (2015). "LSTM: A Search Space Odyssey". IEEE Transactions on Neural Networks and Learning Systems. 28 (10): 2222–2232. arXiv:1503.04069. Bibcode:2015arXiv150304069G. doi:10.1109/TNNLS.2016.2582924. PMID 27411231. S2CID 3356463.
  16. Khaitan, Pranav (18 May 2016). "Chat Smarter with Allo". Research Blog. Retrieved 27 June 2017.
  17. Metz, Cade (27 September 2016). "An Infusion of AI Makes Google Translate More Powerful Than Ever | WIRED".
  18. Efrati, Amir (13 June 2016). "Apple's Machines Can Learn Too". The Information.
  19. Ranger, Steve (14 June 2016). "iPhone, AI and big data: Here's how Apple plans to protect your privacy | ZDNet". ZDNet.
  20. Smith, Chris (13 June 2016). "iOS 10: Siri now works in third-party apps, comes with extra AI features". BGR.
  21. Vogels, Werner (30 November 2016). "Bringing the Magic of Amazon AI and Alexa to Apps on AWS. - All Things Distributed". www.allthingsdistributed.com.
  22. Ong, Thuy (4 August 2017). "Facebook's translations are now powered completely by AI".
  23. Vance, Ashlee (15 May 2018). "(Google, Amazon, and Facebook owe Jürgen Schmidhuber a fortune.) This Man Is the Godfather the AI Community Wants to Forget. Quote: These powers make LSTM arguably the most commercial AI achievement, used for everything from predicting diseases to composing music". Bloomberg Business Week.
  24. Kumar Chellapilla; Sid Puri; Patrice Simard (2006). "High Performance Convolutional Neural Networks for Document Processing". In Lorette, Guy (ed.). Tenth International Workshop on Frontiers in Handwriting Recognition. Suvisoft.
  25. Ciresan, Dan; Ueli Meier; Jonathan Masci; Luca M. Gambardella; Jurgen Schmidhuber (2011). "Flexible, High Performance Convolutional Neural Networks for Image Classification" (PDF). Proceedings of the Twenty-Second International Joint Conference on Artificial Intelligence-Volume Volume Two. 2: 1237–1242 (PDF).
  26. "IJCNN 2011 Competition result table". OFFICIAL IJCNN2011 COMPETITION. 2010.
  27. Schmidhuber, Jürgen (17 March 2017). "History of computer vision contests won by deep CNNs on GPU".