Int8DynamicActivationInt4WeightConfig¶

class torchao.quantization.Int8DynamicActivationInt4WeightConfig(group_size: int = 32, layout: Layout = PlainLayout(), mapping_type: MappingType = MappingType.SYMMETRIC, act_mapping_type: MappingType = MappingType.ASYMMETRIC, set_inductor_config: bool = True)[原始碼]¶

用於將 int8 動態每 token 非對稱啟用量化和 int4 每組權重對稱量化應用於線性層的配置。這用於為 executorch 後端生成模型，但目前 executorch 尚不支援對此流程產生的量化模型的降低。

引數: