Iterative-DualRL: An Optimal Discriminator Weighted Imitation Perspective for Reinforcement Learning

Haoran Xu*¹, Shuozhe Li*¹, Harshit Sikchi¹, Scott Niekum², Amy Zhang^1,3

¹UT Austin ²UMass Amherst ²Meta AI

* Equal contribution

Under construction.