¿Cuál de los siguientes algoritmos NO se utiliza en el aprendizaje por refuerzo?
Deep Q-Network (DQN)
SARSA
Overlook minor misbehaviors
Impose harsh punishments for any infraction

Inteligencia Artificial y Aprendizaje Automático Los ejercicios se están cargando. ...