DreamerValueLoss¶
- class torchrl.objectives.DreamerValueLoss(*args, **kwargs)[原始碼]¶
Dreamer Value Loss。
計算 dreamer value 模型的損失。value 損失在預測值和 lambda 目標之間計算。
參考: https://arxiv.org/abs/1912.01603。
- 引數:
value_model (TensorDictModule) – value 模型。
value_loss (str, optional) – 用於 value 損失的損失函式。預設為
"l2"。discount_loss (bool, optional) – 如果為
True,則使用 gamma 折扣因子對損失進行折扣。預設為 False。gamma (
float, optional) – gamma 折扣因子。預設為0.99。
- default_keys¶
別名:
_AcceptedKeys