評價此頁

PerRow#

class torch.ao.quantization.observer.PerRow[source]#

在量化中表示逐行粒度。

這是逐軸量化的一種特殊情況,並且是Float8矩陣乘法特有的,其中輸入使用塊大小為 (1, …, input.shape[-1]) 的量化。權重使用塊大小為 (1, weight.shape[1]) 的量化。