HardUpdate¶ class torchrl.objectives.HardUpdate(loss_module: DQNLoss | DDPGLoss | SACLoss | TD3Loss, *, value_network_update_interval: float = 1000)[原始碼]¶ 用於 Double DQN/DDPG 中目標網路更新的硬更新類(與軟更新相對)。 這在原始的 Double DQN 論文中被提出:“Deep Reinforcement Learning with Double Q-learning”,https://arxiv.org/abs/1509.06461。 引數: loss_module (DQNLoss 或 DDPGLoss) – 應更新目標網路的損失模組。 關鍵字引數: value_network_update_interval (標量) – 目標網路應更新的頻率。預設值:1000