快捷方式

WorldModelWrapper

class torchrl.modules.tensordict_module.WorldModelWrapper(*args, **kwargs)[原始碼]

世界模型包裝器。

此模組將一個過渡模型和一個獎勵模型包裝在一起。過渡模型用於預測一個假想的世界狀態。獎勵模型用於預測假想過渡的獎勵。

引數:
  • transition_model (TensorDictModule) – 一個生成新世界狀態的過渡模型。

  • reward_model (TensorDictModule) – 一個獎勵模型,它讀取世界狀態並返回獎勵。

get_reward_operator() TensorDictModule[原始碼]

返回一個將世界狀態對映到獎勵的獎勵運算子。

get_transition_model_operator() TensorDictModule[原始碼]

返回一個過渡運算子,該運算子將觀察對映到世界狀態,或將世界狀態對映到下一個世界狀態。

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源