BinarizeReward¶
- class torchrl.envs.transforms.BinarizeReward(in_keys: Sequence[NestedKey] | None = None, out_keys: Sequence[NestedKey] | None = None)[原始碼]¶
將獎勵對映到二元值(如果獎勵為空則為 0,否則為 1)。
- 引數:
in_keys (List[NestedKey]) – 輸入鍵
out_keys (List[NestedKey], optional) – 輸出鍵。預設為
in_keys的值。dtype (torch.dtype, optional) – 二值化獎勵的資料型別。預設為
torch.int8。
- transform_reward_spec(reward_spec: TensorSpec) TensorSpec[原始碼]¶
轉換獎勵的 spec,使其與變換對映匹配。
- 引數:
reward_spec (TensorSpec) – 變換前的 spec
- 返回:
轉換後的預期規範