快捷方式

stateless_init_process_group_async

class torchrl.modules.llm.stateless_init_process_group_async(master_address: str | None, master_port: str | None, rank: int, world_size: int, device)[原始碼]

為分散式通訊(非同步版本)初始化一個無狀態程序組。

建立 StatelessProcessGroup 例項,而不依賴於 torch.distributed 中的全域性程序組。建議使用此方法來初始化外部程序(例如,訓練程序)和 vLLM 工作程序之間的資料平面通訊(NCCL)。

引數:
  • master_address (str | None) – 主節點的地址。如果未指定,則預設為“localhost”。

  • master_port (str | None) – 主節點使用的埠。如果未指定,則自動分配一個開放的埠。

  • rank (int) – 當前程序的 rank。

  • world_size (int) – 分散式組中的總程序數。

  • device – 用於通訊的裝置。

返回:

一個使用建立的 StatelessProcessGroup 例項化的 PyNcclCommunicator 例項。

返回型別:

PyNcclCommunicator

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源