FusedMovingAvgObsFakeQuantize#
- class torch.ao.quantization.fake_quantize.FusedMovingAvgObsFakeQuantize(observer=<class 'torch.ao.quantization.observer.MovingAverageMinMaxObserver'>, quant_min=0, quant_max=255, **observer_kwargs)[source]#
定義一個融合模組來觀察張量。
用於觀察輸入張量(計算最小/最大值)、計算 scale/zero_point 並對張量進行 fake_quantize 的融合模組。該模組使用類似於 MovingAverageMinMaxObserver 的計算方式處理輸入,以計算最小/最大值來得到 scale/zero_point。observer 中的 qscheme 引數用於區分對稱/仿射量化方案。
該模組的輸出為 x_out = (clamp(round(x/scale + zero_point), quant_min, quant_max)-zero_point)*scale
與
FakeQuantize類似,並接受與基類相同的屬性。