快捷方式

Int8WeightOnlyConfig

class torchao.quantization.Int8WeightOnlyConfig(group_size: Optional[int] = None, set_inductor_config: bool = True)[源]

用於將 int8 僅權重對稱逐通道量化應用於線性層的配置。

引數:
  • group_size – Optional[int] = None - 控制量化的粒度。如果為 None,則應用逐通道量化。否則,應用指定組大小的每組量化。

  • set_inductor_config – bool = True - 如果為 True,則調整 torchinductor 設定以推薦值,以獲得此量化方案的更好效能。

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源