FusedMovingAvgObsFakeQuantize#

class torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=0, quant_max=255, **observer_kwargs)[source]#

定義一個融合模組來觀察張量。

用於觀察輸入張量（計算最小/最大值）、計算 scale/zero_point 並對張量進行 fake_quantize 的融合模組。該模組使用類似於 MovingAverageMinMaxObserver 的計算方式處理輸入，以計算最小/最大值來得到 scale/zero_point。observer 中的 qscheme 引數用於區分對稱/仿射量化方案。

該模組的輸出為 x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max)-zero_point)*scale

與 FakeQuantize 類似，並接受與基類相同的屬性。

FusedMovingAvgObsFakeQuantize#

文件

教程

資源