快捷方式

TorchRL

_images/logo.png

TorchRL 是一個用於 PyTorch 的開源強化學習 (RL) 庫。

您可以直接從 PyPI 安裝 TorchRL(有關安裝說明,請參閱下方的專門部分)

$ pip install torchrl

TorchRL 提供以 PyTorch 和 Python 為中心的、低階和高階的 RL 抽象,旨在高效、模組化、文件齊全且經過充分測試。其程式碼旨在支援 RL 研究。其中大部分程式碼以高度模組化的方式用 Python 編寫,研究人員可以輕鬆地替換元件、轉換它們或輕鬆編寫新的元件。

該儲存庫試圖與現有的 PyTorch 生態系統庫保持一致,因為它有一個“資料集支柱” (環境)轉換模型、資料實用程式(例如收集器和容器)等。TorchRL 旨在擁有儘可能少的依賴項(Python 標準庫、numpy 和 PyTorch)。常見的環境庫(例如 OpenAI gym)僅為可選。

在低階方面,TorchRL 提供了一組高度可重用的函式,用於 成本函式回報 和資料處理。

TorchRL 旨在實現高模組化和良好的執行時效能。

要了解 TorchRL 的理念和功能(超出此 API 參考),請檢視 TorchRL 論文

安裝

TorchRL 的釋出與 PyTorch 同步,因此請確保您始終使用 最新版本的 PyTorch 來享受庫的最新功能(儘管核心功能保證向後相容 pytorch>=2.0)。可以透過以下方式安裝 nightly 版本:

$ pip install tensordict-nightly
$ pip install torchrl-nightly

或者,如果您願意為庫做貢獻,可以透過 git clone 來安裝

$ cd path/to/root
$ git clone https://github.com/pytorch/tensordict
$ git clone https://github.com/pytorch/rl
$ cd tensordict
$ python setup.py develop
$ cd ../rl
$ python setup.py develop

入門

一系列快速教程,幫助您快速掌握庫的基本功能。如果您時間緊迫,可以從 系列中的最後一項 開始,並在想了解更多資訊時導航到前面的項!

教程

基礎

中級

高階

參考資料

知識庫

索引和表格

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源