Micole
.es
¿Cuál de los siguientes algoritmos NO se utiliza en el aprendizaje por refuerzo?
Deep Q-Network (DQN)
SARSA
Overlook minor misbehaviors
Impose harsh punishments for any infraction
Inteligencia Artificial y Aprendizaje Automático Los ejercicios se están cargando. ...