Construire des agents interactifs dans les mondes de jeux vidéo

 Construire des agents interactifs dans les mondes de jeux vidéo


Notes

(1) Abramson, J., Ahuja, A., Barr, I., Brussee, A., Carnevale, F., Cassin, M., Chhaparia, R., Clark, S., Damoc, B., Dudzik, A. et Georgiev, P., 2020. Imitation interactive Intelligence. ARXIV Préprint Arxiv: 2012.05672.

(2) Abramson, J., Ahuja, A., Brussee, A., Carnevale, F., Cassin, M., Fischer, F., Georgiev, P., Goldin, A., Harley, T. et Hill, F., 2021. Création d’agents interactifs multimodaux avec imitation et apprentissage automatique. ARXIV Préprint Arxiv: 2112.03763.

(3) Abramson, J., Ahuja, A., Carnevale, F., Georgiev, P., Goldin, A., Hung, A., Landon, J., Lillicrap, T., Muldal, A., Richards, B. et Santoro, A., 2022. Évaluation des agents interactifs multimodaux. ARXIV Préprint Arxiv: 2205.13274.

(4) Bai, Y., Jones, A., Ndousse, K., Askell, A., Chen, A., Dassarma, N., Drain, D., Fort, S., Ganguli, D., Henighan, T. et Joseph, N., 2022. Formation d’un assistant utile et inoffensif avec un renforcement d’apprentissage de la rétroaction humaine. ARXIV PRÉMENTATION ARXIV: 2204.05862.

(5) Christiano, PF, Leike, J., Brown, T., Martic, M., Legg, S. et Amodei, D., 2017. Apprentissage du renforcement profond des préférences humaines. Progrès des systèmes de traitement de l’information neuronaux, 30.



Source link

Related post