¿Cuál es la diferencia entre el aprendizaje por refuerzo sin modelos y el basado en modelos?

¿Cuál es la diferencia entre el aprendizaje por refuerzo sin modelos y el basado en modelos? Me parece que cualquier alumno sin modelo, que aprenda a través de prueba y error, podría reformularse como basado en el modelo. En ese caso, ¿cuándo serían apropiados los alumnos sin...