快捷方式

MarlinSparseLayout

class torchao.dtypes.MarlinSparseLayout[source]

MarlinSparseLayout 是一個用於處理稀疏張量格式的佈局類,它專門為 Marlin 稀疏核心設計。該佈局用於最佳化具有 2:4 稀疏模式的仿射量化張量的儲存和計算。

該佈局確保張量資料以與 Marlin 稀疏核心操作相容的格式進行預處理和儲存。它提供了預處理輸入張量和管理量化張量佈局的方法。

pre_process(input: Tensor) Tensor[source]
預處理輸入張量,使其符合 Marlin 稀疏核心的正確格式。
  • 1. 輸入張量被轉置,因為線性層以轉置格式保留權重。

  • 2. 張量注入 2:4 稀疏性。

  • 3. 再次轉置,因為量化過程將計算 dim=-1 的尺度。

引數:

input (torch.Tensor) – 要預處理的輸入張量。

返回:

預處理後的張量。

返回型別:

torch.Tensor

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源