Tendances de l’IA 2023: Apprentissage par renforcement – RLHF, pré-formation robotique et RL hors ligne avec Sergey Levine

 Tendances de l’IA 2023: Apprentissage par renforcement – RLHF, pré-formation robotique et RL hors ligne avec Sergey Levine


Aujourd’hui, nous plongeons profondément dans le dernier et le plus grand au monde de l’apprentissage du renforcement avec notre ami Sergey Levine, professeur agrégé à l’UC Berkeley. Dans notre conversation avec Sergey, nous explorons certains développements qui changent la donne dans le domaine, y compris la sortie de Chatgpt et le début de RLHF. Nous explorons également plus largement l’intersection des modèles RL et linguistiques, ainsi que les progrès de la RL hors ligne et de la pré-formation pour les modèles de robotique, de la RL inverse, de l’apprentissage Q et une multitude d’articles en cours de route. Enfin, vous ne voulez pas manquer les prédictions de Sergey pour les meilleurs développements de l’année 2023!



Source link

Related post