AdditiveGaussianModule¶
- class torchrl.modules.AdditiveGaussianModule(*args, **kwargs)[原始碼]¶
加性高斯 PO 模組。
- 引數:
spec (TensorSpec) – 用於取樣動作的 spec。取樣動作將在探索後投影到有效的動作空間。
sigma_init (標量, 可選) – 初始 epsilon 值。預設值:1.0
sigma_end (標量, 可選) – 最終 epsilon 值。預設值:0.1
annealing_num_steps (int, 可選) – sigma 達到
sigma_end值所需的步數。預設值:1000mean (
float, 可選) – 每個輸出元素的正態分佈的均值。預設值:0.0std (
float, 可選) – 每個輸出元素的正態分佈的標準差。預設值:1.0
- 關鍵字引數:
action_key (NestedKey, 可選) – 如果策略模組有多個輸出鍵,則其輸出 spec 的型別將是 Composite。需要知道在哪裡找到動作 spec。預設值:“action”
safe (bool) – 如果為
True,則給定的動作 spec 之外的動作將使用TensorSpec.project的啟發式方法投影到該空間內。預設值:Falsedevice (torch.device, 可選) – 需要儲存緩衝區的裝置。
注意
在訓練迴圈中加入對
step()的呼叫對於更新探索因子至關重要。由於不容易捕獲此遺漏,如果省略,將不會引發任何警告或異常!