torch.compiler.cudagraph_mark_step_begin#

torch.compiler.cudagraph_mark_step_begin()[原始碼]#

指示一個新的推理或訓練迭代即將開始。

CUDA Graphs 將會釋放前一個迭代的張量。每次呼叫 `torch.compile` 時都會啟動一個新的迭代，前提是沒有待處理且尚未呼叫的 backward 操作。

如果這個啟發式判斷不正確，例如在下面的示例中，請手動使用此 API 進行標記。

@torch.compile(mode="reduce-overhead")
def rand_foo():
    return torch.rand([4], device="cuda")


for _ in range(5):
    torch.compiler.cudagraph_mark_step_begin()
    rand_foo() + rand_foo()

更多詳情，請參閱 torch.compiler_cudagraph_trees

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源