評價此頁

DTypeWithConstraints#

class torch.ao.quantization.backend_config.DTypeWithConstraints(dtype=None, quant_min_lower_bound=None, quant_max_upper_bound=None, scale_min_lower_bound=None, scale_max_upper_bound=None, scale_exact_match=None, zero_point_exact_match=None)[原始碼]#

用於在 DTypeConfig 中指定給定 dtype 的額外約束的配置,例如量化值範圍、比例值範圍和固定量化引數。

當前支援的約束有:

  • quant_min_lower_boundquant_max_upper_bound:分別表示量化值的最小值和最大值的下限和上限。如果 QConfig 的 quant_minquant_max 超出此範圍,則忽略該 QConfig。

  • scale_min_lower_boundscale_max_upper_bound:分別表示比例值的最小值和最大值的下限和上限。如果 QConfig 的最小比例值(當前公開為 eps)低於下限,則忽略該 QConfig。請注意,當前不強制執行上限。

  • scale_exact_matchzero_point_exact_match:比例值和零點的精確匹配要求,用於具有固定量化引數的運算元,例如 sigmoid 和 tanh。如果 QConfig 中指定的觀察者不是 FixedQParamsObserverFixedQParamsFakeQuantize,或者量化引數不匹配,則忽略該 QConfig。