UnsqueezeTransform¶
- class torchrl.envs.transforms.UnsqueezeTransform(*args, **kwargs)[原始碼]¶
在指定位置插入大小為一的維度。
- 引數:
dim (int) – 要 unsqueeze 的維度。必須為負數(或允許 allow_positive_dim 為 True)。
- 關鍵字引數:
allow_positive_dim (bool, optional) – 如果為
True,則接受正維度。`UnsqueezeTransform` 會將這些維度對映到父環境的第 n 個特徵維度(即在父環境 batch size 之後的第 n 個維度),獨立於 tensordict 的 batch size(因此,正維度在傳遞不同 batch 尺寸的 tensordict 的情況下可能存在風險)。預設為 False,即不允許非負維度。in_keys (list of NestedKeys) – 輸入條目(讀取)。
out_keys (list of NestedKeys) – 輸出條目(寫入)。如果未提供,則預設為
in_keys。in_keys_inv (list of NestedKeys) – 在呼叫
inv()期間的輸入條目(讀取)。out_keys_inv (list of NestedKeys) – 在呼叫
inv()期間的輸出條目(寫入)。如果未提供,則預設為in_keys_in。
- transform_action_spec(action_spec: TensorSpec) TensorSpec[原始碼]¶
轉換動作規範,使結果規範與變換對映匹配。
- 引數:
action_spec (TensorSpec) – 變換前的規範
- 返回:
轉換後的預期規範
- transform_observation_spec(observation_spec: TensorSpec) TensorSpec[原始碼]¶
轉換觀察規範,使結果規範與轉換對映匹配。
- 引數:
observation_spec (TensorSpec) – 轉換前的規範
- 返回:
轉換後的預期規範
- transform_reward_spec(reward_spec: TensorSpec) TensorSpec[原始碼]¶
轉換獎勵的 spec,使其與變換對映匹配。
- 引數:
reward_spec (TensorSpec) – 變換前的 spec
- 返回:
轉換後的預期規範
- transform_state_spec(state_spec: TensorSpec) TensorSpec[原始碼]¶
轉換狀態規範,使結果規範與變換對映匹配。
- 引數:
state_spec (TensorSpec) – 變換前的規範
- 返回:
轉換後的預期規範