choose_qparams_affine_with_min_max¶

torchao.quantization.choose_qparams_affine_with_min_max(min_val: Tensor, max_val: Tensor, mapping_type: MappingType, block_size: Tuple[int, ...], target_dtype: dtype, quant_min: Optional[int] = None, quant_max: Optional[int] = None, eps: Optional[float] = None, scale_dtype: Optional[dtype] = None, zero_point_dtype: Optional[dtype] = None, preserve_zero: bool = True, zero_point_domain: ZeroPointDomain = ZeroPointDomain.INT) → Tuple[Tensor, Tensor][原始碼]¶

與 choose_qparams_affine() 運算元類似，但直接傳入 min_val 和 max_val 而不是從中派生。這用於靜態量化中的觀察器，其中 min_val 和 max_val 可以透過跟蹤校準資料集中的所有資料來獲得。

:param 與 choose_qparams_affine() 幾乎相同。有一個: :difference: ：不傳入 input Tensor 並用它來計算 min_val/max_val: :param: :param: 然後是 scale/zero_point:: :param: 我們直接傳入 min_val/max_val:

choose_qparams_affine_with_min_max¶

文件

教程

資源