LongBenchベンチマークにおける、各手法のKVキャッシュ圧縮時の精度(スコア)を示したグラフ。カッコ内は消費するメモリのビット幅。TurboQuantは、わずか2.5~3.5ビットの少ないメモリ消費量でありながら、16.0ビットのフルキャッシュ(非圧縮)とほぼ同等の高いスコアを維持している