目錄

快捷方式

HardUpdate¶

class torchrl.objectives.HardUpdate(loss_module: DQNLoss | DDPGLoss | SACLoss | TD3Loss, *, value_network_update_interval: float = 1000)[原始碼]¶

用於 Double DQN/DDPG 中目標網路更新的硬更新類（與軟更新相對）。

這在原始的 Double DQN 論文中被提出：“Deep Reinforcement Learning with Double Q-learning”，https://arxiv.org/abs/1509.06461。

引數:: loss_module (DQNLoss 或 DDPGLoss) – 應更新目標網路的損失模組。
關鍵字引數:: value_network_update_interval (標量) – 目標網路應更新的頻率。預設值：1000

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源