leapmindのblue-oil メモ2
dlk graphのグラフレベルの最適化で行っていることをリストアップしてみた. 中途半端だけど、、、追記するかも
pass_remove_identities
identity node(何もしないnode)を削除する.
pass_transpose
すべてのnodeのshapeをNHWCに変更
pass_propagate_quantization_details_into_conv
Quantizer nodeの情報をconvに伝える.その情報をもとにconvを量子化できる.
pass_compute_thresholds
pass_pack_weights
convolutionを32bitにpackする. op_typeがQTZ_binary_mean_scaling, QTZ_linear_mid_tread_half, QTZ_binary_channel_wise_mean_scalingのとき適用.
pass_quantize_convolutions
packじゃない量子化.
pass_propagate_output_type_backward
pass_propagate_datatypes
conv以外の量子化情報保持nodeのinputのdtypeをoutputのdtypeにする.