Apprentissage du renforcement à l’envers avec Jürgen Schmidhuber

 Apprentissage du renforcement à l’envers avec Jürgen Schmidhuber


Aujourd’hui, nous sommes rejoints par Jürgen Schmidhuber, co-fondateur et scientifique en chef de Nnasense, directeur scientifique d’IDSIA, ainsi que professeur d’IA à USI et SUPSI en Suisse. Le laboratoire de Jürgen est bien connu pour créer le long réseau de mémoire à court terme (LSTM) qui est devenu un réseau neuronal répandu, a utilisé généralement des appareils tels que les smartphones, dont nous discutons en détail dans notre première conversation avec Jürgen en 2017. Dans cette conversation, nous plongeons dans certains des travaux récents de Jürgen, y compris son article récent, Apprentissage du renforcement à l’envers: ne prédisez pas les récompenses – il suffit de les cartographier en actions.



Source link

Related post