快捷方式

ConstantKLController

class torchrl.data.ConstantKLController(*, kl_coef: float | None = None, model: nn.Module | None = None)[source]

Constant KL Controller。

此控制器在收到更新值時保持固定的係數,無論其值如何。

關鍵字引數:
  • kl_coeffloat)– 在計算獎勵時用於乘以 KL 的係數。

  • modelnn.Module, optional)– 需要控制的包裝模型。必須具有 "kl_coef" 屬性。如果提供,則 "kl_coef" 將就地更新。

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源