UnityMLAgentsWrapper¶
- torchrl.envs.UnityMLAgentsWrapper(*args, **kwargs)[原始碼]¶
Unity ML-Agents 環境包裝器。
GitHub: https://github.com/Unity-Technologies/ml-agents
文件: https://unity-technologies.github.io/ml-agents/Python-LLAPI/
- 引數:
env (mlagents_envs.environment.UnityEnvironment) – 要包裝的 ML-Agents 環境。
- 關鍵字引數:
device (torch.device, 可選) – 如果提供,則為要將資料強制轉換為的裝置。預設為
None。batch_size (torch.Size, 可選) – 環境的批處理大小。預設為
torch.Size([])。allow_done_after_reset (bool, optional) – 如果為
True,則允許在呼叫reset()後立即將環境設定為done。預設為False。group_map (MarlGroupMapType 或 Dict[str, List[str]]], 可選) – 如何在 tensordicts 中分組代理以進行輸入/輸出。有關更多資訊,請參閱
MarlGroupMapType。如果未指定,代理將根據 Unity 環境提供的組 ID 進行分組。預設為None。categorical_actions (bool, 可選) – 如果為
True,則分類規範將轉換為等效的 TorchRL (torchrl.data.Categorical),否則將使用獨熱編碼 (torchrl.data.OneHot)。預設為False。
- 變數:
available_envs – 可用於構建的已註冊環境列表
示例
>>> from mlagents_envs.environment import UnityEnvironment >>> base_env = UnityEnvironment() >>> from torchrl.envs import UnityMLAgentsWrapper >>> env = UnityMLAgentsWrapper(base_env) >>> td = env.reset() >>> td = env.step(td.update(env.full_action_spec.rand()))