SoftUpdate¶
- class torchrl.objectives.SoftUpdate(loss_module: DQNLoss | DDPGLoss | SACLoss | REDQLoss | TD3Loss, *, eps: float | None = None, tau: float | None = None)[原始碼]¶
用於 Double DQN/DDPG 中目標網路更新的軟更新類。
該方法在“CONTINUOUS CONTROL WITH DEEP REINFORCEMENT LEARNING”中提出,https://arxiv.org/pdf/1509.02971.pdf
只能指定一個衰減因子(tau 或 eps)。