快捷方式

Float8DynamicActivationInt4WeightConfig

class torchao.quantization.Float8DynamicActivationInt4WeightConfig(packing_format: PackingFormat = 'preshuffled')[原始碼]

應用於線性層的 float8 動態每行量化和 int4 每組權重量化的配置(目前僅支援 group_size 128,因為底層核心僅支援 128 及以上,且沒有使其更大的優勢)。

引數:

packing_format – 權重如何打包,僅支援 preshuffled

文件

訪問全面的 PyTorch 開發者文件

檢視文件

教程

為初學者和高階開發者提供深入的教程

檢視教程

資源

查詢開發資源並讓您的問題得到解答

檢視資源